Nghiên cứu kỹ thuật tra cứu ảnh và ứng dụng trong tra cứu cây thuốc - Pdf 18



Số hóa bởi Trung tâm Học liệu
ĐẠI HỌC THÁI
NGUYÊNTRƢỜNG
ĐẠI HỌC C VÀ Nguyễn Thị
Bích Hạnh

Thái Nguyên – 2013 Số hóa bởi Trung tâm Học liệu
ĐẠI HỌC THÁI
NGUYÊNTRƢỜNG
ĐẠI HỌC VÀ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY
TÍNH
NGƢỜI HƢỚNG
DẪN KHOA HỌC
TS. Nguyễn Văn Tảo Thái Nguyên -
2013i

LỜI CẢM ƠN Trong suốt thời gian hoàn thành luận văn nghiên cứu, tôi luôn nhận đƣợc giúp
đỡ tận tình của thầy giáo hƣớng dẫn và biết bao ngƣời thân yêu bên tôi.
Nhân dịp này, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới TS.
Nguyễn Văn Tảo về những chỉ dẫn khoa học, những góp ý quý báu và tận tình
hƣớng dẫn tôi trong suốt quá trình thực hiện luận văn tốt nghiệp.
Tôi xin chân thành cảm ơn tập thể các Thầy, Cô giáo trong
trƣờng
Đại học Công
nghệ thông tin và Truyền thông đã luôn nhiệt tình quan tâm, giúp đỡ và tạo mọi
điều kiện tốt nhất cho tôi trong suốt quá trình học tập tại trƣờng.
Xin chân thành cảm ơn tới tập thể các thầy cô và các bạn đồng nghiệp Trung
tâm Nghiên cứu và Phát triển Nông Lâm nghiệp miền núi phía Bắc - Trƣờng Đại
học Nông Lâm nơi tôi đang công tác; các bạn trƣờng Đại học Y Thái Nguyên đã
luôn cổ vũ, động viên và tạo mọi điều kiện thuận lợi để tôi hoàn thành luận văn của
mình.
Cuối cùng, tôi muốn bày tỏ lòng cảm ơn vô hạn tới bạn bè, tới những ngƣời
thân yêu luôn bên tôi. Xin bày tỏ lòng cảm ơn sâu sắc tới bố mẹ, chồng, con và
những ngƣời thân trong gia đình đã là điểm tựa tinh thần lẫn vật chất cho tôi trong
những lúc khó khăn, luôn bên cạnh và động viên tôi trong suốt quá trình thực hiện
luận văn tốt nghiệp.
Xin trân trọng cảm ơn tất cả sự giúp đỡ quý báu đó! Sinh viên


1.5.5. Hệ thống Imatch 17
1.5.6. Mô tơ tìm kiếm WWW ImageRover 17
Chƣơng 2. MỘT SỐ KỸ THUẬT TRA CỨU ẢNH DỰA VÀO NỘI DUNG 18
2.1. Tra cứu ảnh dựa vào màu sắc 18
2.1.1. Màu sắc 18
2.1.2. Một số đặc tính đặc biệt về màu sắc 19
2.1.3. Các không gian màu 19
2.1.4. Lượng tử hóa màu và lược đồ màu 24
iv 2.1.5. Đo khoảng cách giữa các lược đồ màu 29
2.2. Tra cứu ảnh dựa vào hình dạng 32
2.2.1. Khái niệm về hình dạng 32
2.2.2. Đặc điểm hình dạng với việc tìm kiếm ảnh 32
2.2.3. Lược đồ hình dạng 34
2.2.4. Biểu diễn hình dạng trên cơ sở vùng và thước đo đồng dạng 35
2.3. Tra cứu ảnh dựa vào vân 39
2.3.1. Vân là gì? 39
2.3.2. Tra cứu ảnh dựa vào vân 40
2.3.3. Phân hoạch vùng nhị phân cục bộ 41
2.3.4. Phân đoạn vân 41
2.4. Phƣơng pháp tra cứu ảnh sử dụng dấu hiệu nhị phân 41
2.4.1. Giới thiệu 41
2.4.2. Kiến trúc hệ thống 43
2.4.3. Kỹ thuật tra cứu ảnh theo nội dung dựa vào dấu hiệu nhị phân 44
2.4.4. Độ đo tương tự 48
Chƣơng 3. XÂY DỰNG CHƢƠNG TRÌNH TRA CỨU ẢNH CÂY THUỐC 52
3.1. Giới thiệu bài toán tra cứu ảnh cây thuốc 52
3.2. Phân tích bài toán 53

QBE
Query by Example
Truy vấn bởi ảnh mẫu
4
QBF
Query by Feature
Truy vấn bởi đặc trƣng
5
QBIC
Query By Image Content
Truy vấn ảnh dựa vào nội
dung
6
RGB
Red Green Blue
Đỏ, Xanh lục, Xanh lơ
7
HSV
Hue, Saturation, Value
Màu, độ bão hòa màu, độ sáng
8
CCV
Color Coherence Vectors
Véc tơ gắn kết màu
9
CIE
Commission International d'E
clairage
Ủy ban quốc tế về màu sắc
10
vi DANH MỤC CÁC HÌNH
Hình 1.1: Các bƣớc cơ bản trong một hệ thống xử lý
ảnh
3
Hình 1.2: Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung 13
Hình 2.1: Mô tả không gian màu RGB 20
Hình 2.2: Mô tả không gian màu HSV 21
Hình 2.3: Lƣợc đồ màu HIS cải tiến. 28
Hình 2.4: Khoảng cách dạng Minkowski. 29
Hình 2.5: Khoảng cách dạng toàn phƣơng. 30
Hình 2.6: Hình dạng sau khi đã chồng lƣới 35
Hình 2.7: Hình dạng trên hình 2.6 sau khi đã đƣợc chuẩn hóa 37
Hình 2.8: Đo hai hình dạng trên cơ sở chỉ mục 37
Hình 2.9: Một số loại vân tiêu biểu 40
Hình 2.10: Kiến trúc của kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân. 43
Hình 2.11: Mẫu thiết lập hình ảnh. 45
Hình 3.1: Kiến trúc tổng quát của hệ thống tra cứu ảnh. 54
Hình 3.2: Mô hình chi tiết của hệ thống tra cứu ảnh 55
Hình 3.3: Tiền xử lý ảnh dữ liệu. 57
Hình 3.4: Biểu đồ Use Case. 57
Hình 3.5: Biểu đồ trình tự của tác nhân tra cứu. 58
Hình 3.6: Biểu đồ cộng tác của tác nhân tra cứu. 58
Hình 3.7: Biểu đồ hoạt động của tác nhân tra cứu ảnh. 59
Hình 3.8: Biểu đồ trình tự của tác nhân quản lý CSDL ảnh. 60
Hình 3.9: Biểu đồ cộng tác của tác nhân quản lý CSDL ảnh 60

PHẦN MỞ ĐẦU
Ngày nay cùng với sự phát triển của các ngành khoa học khác, ngành công nghệ
thông tin cũng có những bƣớc phát triển nhanh chóng, ngày càng có nhiều ứng dụng
vào thực tiễn cuộc sống và đem lại hiệu quả cao. Việc quản lý thông tin rất cần tới các
công cụ để thu thập, phân loại tổ chức ở các dạng dữ liệu khác nhau một cách hiệu
quả. Trong khi các hệ thống quản lý thông tin dựa vào văn bản đã rất thành công
nhƣng chúng vẫn không đáp ứng đƣợc việc quản lý, khai thác và xử lý dữ liệu với khối
lƣợng khổng lồ nhƣ hiện nay. Ảnh số ngày càng thu hút đƣợc sự quan tâm của nhiều
ngƣời,
một phần là do các thiết bị thu nhận ảnh số ngày càng phổ biến và có giá cả
phù hợp, cho phép nhiều
ngƣời
có thể sở hữu và sử dụng. Tra cứu và quản trị cơ sở dữ
liệu ảnh thu hút sự quan tâm của nhiều nhà nghiên cứu từ những năm 1970. Với sự
tăng nhanh về tốc độ máy tính và giảm chi phí bộ nhớ, các cơ sở dữ liệu ảnh chứa
hàng nghìn thậm chí hàng triệu ảnh đƣợc sử dụng trong nhiều lĩnh vực ứng dụng khác
nhau nhƣ y học, ảnh vệ tinh, các cơ sở dữ liệu ảnh sinh học và các cơ sở dữ liệu ảnh
phong cảnh Các ứng dụng này đòi hỏi độ chính xác tra cứu cao.
Khi có nhu cầu tra cứu một vài bức ảnh nào đó trong một cơ sở dữ liệu có
hàng trăm ngàn ảnh, điều này khó có thể thực hiện đƣợc khi ta tra cứu bằng tay theo
cách thông thƣờng, nghĩa là xem từng tấm ảnh một cho đến khi thấy ảnh có nội dung
cần tìm. Với sự tăng nhanh về số lƣợng ảnh, cách tiếp cận tra cứu ảnh dựa vào chú
thích ảnh thủ công trở nên không khả thi về cả thời gian và chi phí.
Do đó, khi số lƣợng ảnh đƣợc lƣu trữ trở nên rất lớn thì vấn đề đặt ra là phải
có những phƣơng pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tra
cứu, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt mới đáp ứng đƣợc
nhu cầu ngày càng cao của con ngƣời. Việc xây dựng các hệ thống tra cứu ảnh là rất
cần thiết. Trong thực tế, bài toán tra cứu ảnh số có rất nhiều ứng dụng quan trọng. Ví
dụ


cạn kiệt dần nguồn tài nguyên dƣợc liệu.
Trên thế giới, việc nghiên cứu, phát hiện, khai thác và quản lý cây dƣợc liệu đã
nhận đƣợc sự quan tâm nghiên cứu của nhiều nhà quản lý, nhà khoa học và nhà y -
dƣợc. Họ không chỉ thu thập, khai thác, quản lý mà còn xây dựng các cơ chế ứng dụng
tiến bộ khoa học và công nghệ vào nhận dạng, quản lý và bảo vệ cũng nhƣ bảo tồn cây
dƣợc liệu một cách hiệu quả. Ở Việt Nam việc quản lý và khai thác cây dƣợc liệu vẫn
chỉ mang tính chất tự phát nên cần có sự quản lý và khai thác đồng bộ trên cơ sở phát
hiện, nhận dạng và bảo tồn các loài cây dƣợc liệu quý là một việc làm cấp thiết.
Xuất phát từ thực tế nêu trên, luận văn đƣợc lựa chọn là: “Nghiên cứu kỹ thuật
tra cứu ảnh và ứng dụng trong tra cứu cây thuốc” .
Bố cục luận văn gồm 3 phần: Phần mở đầu, phần kết luận và 3 chƣơng nội dung.
Chương 1: Tổng quan về tra cứu ảnh dựa vào nội dung.
Chương 2: Một số kỹ thuật tra cứu ảnh dựa vào nội dung.
Chương 3: Xây dựng chƣơng trình tra cứu ảnh cây thuốc.
3 Chƣơng 1
TỔNG QUAN VỀ TRA CỨU ẢNH DỰA VÀO NỘI DUNG

1.1. Tổng quan về xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với các ngành khoa học khác nhƣng tốc độ phát triển của nó rất
nhanh, kích thích các trung tâm nghiên cứu ứng dụng, đặc biệt là máy tính chuyên
dụng cho nó.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào nhằm cho
ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một
ảnh “tốt hơn” hoặc một kết luận.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ là
đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tƣợng

ảnh
(Scanner,
Camera,Sensor)Tiền xử lý
Trích chọn
đặc điểm

Hậu xử lý
Hệ quyết định
Đối sánh rút
ra kết luận
4 loại ảnh thông dụng Raster, Vector. Các thiết bị thu nhận ảnh thông thƣờng Raster
là camera, các thiết bị thu nhận ảnh thông thƣờng Vector là sensor hoặc bàn số
hoá Digitalizer hoặc đƣợc chuyển đổi từ ảnh Raster.
Trƣớc đây ảnh thu đƣợc qua camera là ảnh tƣơng tự nhƣng gần đây với sự phát
triển của công nghệ, ảnh màu hay ảnh đen trắng lấy đƣợc từ camera sau đó đƣợc
chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác ảnh có thể thu
đƣợc từ vệ tinh hoặc máy quét ảnh.
 Tiền xử lý
Sau bộ thu nhận ảnh có thể bị nhiễu hoặc có độ tƣơng phản thấp nên cần đƣa
vào bộ tiền xử lý để nâng cao chất lƣợng. Chức năng của bộ tiền xử lý là lọc nhiễu,
nâng cao độ tƣơng phản,…
 Trích chọn đặc điểm
Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:

Một số đối tƣợng nhận dạng ảnh khá phổ biến hiện nay là nhận dạng kí tự (chữ
in, chữ viết tay, chữ kí điện tử), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
ngƣời [1].
1.2. Khái quát về tra cứu ảnh
Tra cứu ảnh là một quá trình tra cứu trong một cơ sở dữ liệu ảnh những ảnh thỏa
mãn một yêu cầu nào đó. Ví dụ ngƣời sử dụng có thể tra cứu tất cả các ảnh chủ đề về
“Cây thuốc thảo dƣợc” trong một cơ sở dữ liệu ảnh hoặc một ngƣời sử dụng khác lại
muốn phân loại cơ sở ảnh của mình thành các bộ sƣu tập có chủ đề khác nhau. Một ví
dụ khác là một ngƣời muốn tìm tất cả các ảnh tƣơng tự với một bức ảnh mẫu nào đó
trong một cơ sở dữ liệu ảnh.
Theo Wikipedia: Hệ thống tra cứu ảnh là một hệ thống máy tính sử dụng để
duyệt, tra cứu và tra cứu ảnh từ một cơ sở dữ liệu ảnh số lớn.
Trƣớc năm 1990,
ngƣời
ta
thƣờng
sử dụng
ph
ƣ
ơng
pháp tra cứu ảnh theo văn
bản (Text Based Image Retrieval). Theo cách này
ngƣời
ta sẽ gán cho mỗi bức ảnh
6 một lời chú thích phù hợp với nội dung hoặc một đặc điểm nào đó của ảnh, sau đó
việc tra cứu ảnh
đƣợc

CBIR) [16]. Phƣơng pháp tra cứu ảnh theo nội dung ra đời đã khắc phục đƣợc những
nhƣợc điểm của phƣơng pháp từ khóa. CBIR là một lĩnh vực khoa học đƣợc phát triển
dựa trên cơ sở lý thuyết và ứng dụng của xử lý ảnh. Hệ thống cho phép ngƣời dùng tra
cứu các ảnh tƣơng tự trong một cơ sở dữ liệu hình ảnh.
CBIR đƣợc thực hiện thông qua việc tính độ tƣơng tự giữa hai bức ảnh đƣợc biểu
diễn bởi một trong số các đặc trƣng mức thấp của ảnh nhƣ: Màu sắc, hình dạng, kết
cấu… Kết quả đƣa ra là tập các bức ảnh tƣơng tự với ảnh truy vấn đƣợc sắp xếp theo
thứ tự giảm dần độ tƣơng tự. Cụm từ CBIR đƣợc T.Kato đƣa ra vào năm 1992 trong
quá trình thu thập ảnh một cách tự động từ cơ sở dữ liệu dựa trên biểu diễn màu sắc và
hình dạng của ảnh.
Có hai cách tiếp cận chung đối với các giải pháp cho vấn đề tra cứu thông tin
dựa trên dạng thông tin trực quan đó là các phƣơng pháp dựa trên đặc trƣng và các
phƣơng pháp dựa trên văn bản mô tả ảnh. Các phƣơng pháp dựa trên văn bản mô tả ảnh
dựa trên các phƣơng pháp tra cứu thông tin văn bản truyền thống và hệ quản trị cơ sở
dữ liệu cũng nhƣ sự can thiệp của con ngƣời để trích rút siêu dữ liệu về một đối tƣợng
trực quan và kết hợp nó cùng với đối tƣợng trực quan nhƣ một chú thích văn bản. Tuy
7 nhiên, gán các thuộc tính văn bản một cách thủ công cần nhiều thời gian và chi phí.
Hơn nữa, các chú thích thủ công thƣờng phụ thuộc rất nhiều vào nhận thức chủ quan
của con ngƣời. Nhận thức chủ quan và chú thích thiếu chính xác là nguyên nhân tra
cứu không chính xác trong các quá trình tra cứu.
Các vấn đề đối với việc truy cập các ảnh và video dựa vào văn bản đã thúc đẩy
nhanh chóng sự quan tâm phát triển các giải pháp dựa vào nội dung. Với giải pháp này,
thay vì đƣợc chú thích một cách thủ công bởi các từ khoá dựa vào văn bản, các ảnh có
thể đƣợc trích rút sử dụng một số đặc trƣng trực quan nhƣ màu, hình dạng và kết cấu
và đƣợc đánh chỉ số dựa trên các các đặc trƣng trực quan này. Cách tiếp cận này dựa
chủ yếu vào các kết quả từ thị giác máy. Tuy nhiên, không có đặc trƣng riêng lẻ tốt
nhất mà cho các kết quả chính xác. Thông thƣờng một sự kết hợp các đặc trƣng một

giữa hai ảnh đƣợc dựa trên các khoảng cách lƣợc đồ giữa các khối tƣơng ứng. Phƣơng
pháp này không có khả năng xử lý đối với các biến đổi hình học nhƣ quay và dịch
chuyển, bị một số vấn đề về đan chéo và biến đổi với vị trí không gian. Một số giải
pháp đã đƣợc đề xuất để làm cho cách tiếp cận dựa vào lƣới bất biến đối với quay và
dịch chuyển nhƣng các giải pháp này tốn nhiều thời gian.
Natsev và cộng sự thực hiện tra cứu ảnh dựa vào nội dung dựa trên thuộc tính bố
cục màu. Mỗi ảnh đƣợc chia thành một số ảnh con bằng việc dịch chuyển các cửa sổ có
cỡ khác nhau và với mỗi ảnh con, một dấu hiệu bố cục màu đƣợc trích rút. Độ tƣơng tự
giữa các ảnh đƣợc tính toán bằng việc so sánh các dấu hiệu của các ảnh con này. Ƣu
điểm của hệ thống này là có thể giảm các nhạy cảm với tỉ lệ và trƣợt, nhƣợc điểm là độ
phức tạp tính toán tăng và hệ thống không xem xét đến đặc trƣng hình.
Smith và Chang đã đề xuất các tập màu. Phƣơng pháp xấp xỉ lƣợc đồ màu để
tăng tốc quá trình tra cứu trong trƣờng hợp cơ sở dữ liệu ảnh rất lớn. Tập màu đƣợc
chọn từ không gian màu đƣợc lƣợng hoá và từ các đặc trƣng đƣợc biểu diễn nhƣ một
xâu bít, một cây nhị phân đƣợc sử dụng để tăng tốc quá trình tra cứu.
Một cách tiếp cận dựa vào màu khác đƣợc đề xuất trong, ở đây một ảnh đƣợc
biểu diễn với sự trợ giúp của ba mô men màu trung bình, phƣơng sai và độ lệch. Kỹ
thuật có ƣu điểm là tính toán đơn giản và chi phí không gian thấp. Độ tƣơng tự giữa hai
ảnh đƣợc tính nhƣ là tổng trọng số của các sai khác giữa các mô men trong ảnh truy
vấn và các mô men của tất cả các ảnh trong cơ sở dữ liệu. Thậm chí thông qua các mô
men màu có thể ngăn chặn các ảnh hƣởng của lƣợng hoá (không giống nhƣ lƣợc đồ
màu). Cách tiếp cận thiếu thông tin không gian.
9 Pass và cộng sự đã đề xuất một phƣơng pháp mới sử dụng véc tơ gắn kết màu
(CCV). Họ đã đề xuất một cách tiếp cận dựa vào lƣợc đồ màu kết hợp với thông tin
không gian. Ảnh đƣợc làm mờ để loại đi các khác biệt nhỏ giữa các pixel và sau đó
không gian màu đƣợc lƣợng hoá thành n màu. Các pixel trong phạm vi một bin màu
đƣợc phân lớp hoặc là gắn kết hoặc là không gắn kết phụ thuộc vào chúng có thuộc vào

đồ màu
tƣơng
tự,
nhƣng
các vị trí không gian
của chúng trong các ảnh là khác nhau. Do đó, vị trí không gian của các vùng (hoặc
các đối tƣợng) hoặc quan hệ không gian giữa nhiều vùng (hoặc đối tƣợng
)
trong
một ảnh thì rất hữu ích cho tìm kiếm các ảnh.
10 Thu thông tin không gian của các đối tƣợng trong một ảnh là một quá trình quan
trọng đối với các hệ thống GIS. Quá trình này bao gồm việc biểu diễn vị trí không
gian tuyệt đối và cũng bao gồm vị trí không gian tƣơng đối của các đối tƣợng
.
Các thao tác nhƣ giao và chồng
đƣợc
sử dụng. Bố cục màu kết hợp thông tin không
gian với thông tin màu xuất hiện trong ảnh và tạo ra một đặc trƣng

rất quan trọng
trong quá trình tra cứu, gọi là đặc trƣng

màu – không gian.
Biểu diễn quan hệ không gian
đƣợc
sử dụng rộng rãi nhất là các xâu 2D
đƣợc đề

tƣợng
hoặc các vùng
thƣờng
là không
khả thi ngoại trừ các ứng dụng rất giới hạn. Mặc dù một số hệ thống chia các ảnh thành
các khối đều, chỉ thu
đƣợc
sự thành công khiêm tốn với các
lƣợc
đồ chia không gian
11 nhƣ thế do hầu hết các ảnh tự nhiên không thể ép thành các khối con đều về không
gian. Để giải quyết vấn đề này, một phƣơng pháp dựa vào biến đổi radon, tận dụng
phân bố không gian của các đặc
trƣng
trực quan không cần phân đoạn phức tạp.
1.2.5. Phân đoạn
Phân đoạn là quá trình phân ảnh ra thành các vùng mà về lý
tƣởng
nó sẽ tƣơng
ứng với các đối tƣợng xuất hiện trong ảnh. Đây là bƣớc rất quan trọng đối với tra
cứu ảnh. Cả đặc
trƣng
hình và đặc
trƣng
bố cục phụ thuộc vào phân đoạn tốt. Trong
phần này chúng tôi sẽ mô tả một số kỹ thuật phân đoạn đã có
đƣợc

hợp này chỉ là các vùng,
mà không là các đối
tƣợng.
Để thu
đƣợc
các đối
tƣợng
mức cao, nó cần có sự trợ giúp
của con ngƣời.
Samadani và Han đã đề xuất một cách tiếp cận trích rút đƣờng bao đƣợc trợ
12 giúp bởi máy tính, nó kết hợp các đầu vào thủ công từ
ngƣời
sử dụng với các biên ảnh
đƣợc
sinh ra bởi máy tính. Trong khi đó, Daneel và cộng sự đã phát triển một phƣơng
pháp cải tiến của các chu tuyến thiết thực. Dựa trên đầu vào của
ngƣời
sử dụng, đầu
tiên thuật toán sử dụng một thủ tục tham lam để cung cấp sự hội tụ ban đầu nhanh.
Thứ hai, nét ngoài
đƣợc
lọc bằng việc sử dụng quy hoạch động. Rui và cộng sự đã đề
xuất một thuật toán dựa vào phân cụm và nhóm trong không gian - màu - kết cấu.
Ngƣời
sử dụng định nghĩa đối tƣợng quan tâm là ở đâu, và thuật toán nhóm các vùng
thành các đối tƣợng


Hình 1.2: Kiến trúc hệ thống tra cứu ảnh dựa vào nội dung
Chúng ta nhận thấy rằng trên một mặt của một hệ thống tra cứu ảnh dựa vào nội
dung, có các nguồn thông tin trực quan ở các khuôn dạng khác nhau và trên mặt kia có
các truy vấn ngƣời sử dụng. Hai mặt này đƣợc liên kết thông qua một chuỗi các tác vụ
nhƣ đƣợc minh họa trong Hình 1.2. Hai tác vụ phân tích truy vấn ngƣời sử dụng và
đánh chỉ số nhiều chiều đƣợc tóm lƣợc ở đây trong khi hai tác vụ quan trọng nhất:
“Phân tích các nội dung của thông tin nguồn” (trích rút đặc trƣng) và “Định nghĩa một
chiến lƣợc để đối sánh các truy vấn tìm kiếm với thông tin trong cơ sở dữ liệu đƣợc lƣu
trữ” (các độ đo tƣơng tự).
14  Truy vấn ngƣời sử dụng
Có nhiều cách gửi một truy vấn trực quan. Một phƣơng pháp truy vấn tốt là một
phƣơng pháp tự nhiên đối với ngƣời sử dụng cũng nhƣ thu đƣợc đủ thông tin từ ngƣời
sử dụng để trích rút các kết quả có ý nghĩa.
Các phƣơng pháp truy vấn dƣới đây đƣợc sử dụng phổ biến trong nghiên cứu tra
cứu ảnh dựa vào nội dung.
 Truy vấn bởi ảnh mẫu
Trong loại truy vấn bởi ảnh mẫu (QBE), ngƣời sử dụng hệ thống chỉ rõ một ảnh
truy vấn đích, dựa trên ảnh truy vấn đó hệ thống sẽ tìm kiếm trong cơ sở dữ liệu ảnh
các ảnh tƣơng tự nhất. Ảnh truy vấn có thể là một ảnh thông thƣờng, một bản quét của
một ảnh có độ phân giải thấp, hoặc một phác thảo của ngƣời sử dụng sử dụng các công
cụ mô tả giao diện đồ hoạ. Một ƣu điểm chính của loại hệ thống này đó là nó là một
cách tự nhiên cho những ngƣời sử dụng chung và chuyên gia để tìm kiếm một cơ sở dữ
liệu ảnh.
 Truy vấn bởi đặc trƣng
Trong hệ thống truy vấn bởi đặc trƣng (QBF) tiêu biểu, những ngƣời sử dụng
chỉ rõ các truy vấn bằng việc chỉ rõ các đặc trƣng họ quan tâm cho tìm kiếm. Thí dụ,
một ngƣời sử dụng có thể truy vấn một cơ sở dữ liệu ảnh bằng việc đƣa ra một lệnh để

Thiết kế thời trang và nội thất.
Báo chí quảng cáo.
Chuẩn đoán y học.
Hệ thống thông tin địa lý.
Di sản văn hóa.
Giáo dục và đào tạo.
Giải trí.
Tra cứu trang web.
16 1.5. Một số hệ thống tra cứu ảnh theo nội dung tiêu biểu
1.5.1. Hệ thống QBIC
Hệ thống QBIC (Query By Image Content) của hãng IBM là một hệ thống tra
cứu ảnh thƣơng

mại đầu tiên và nổi tiếng nhất trong số các hệ thống tra cứu ảnh dựa
trên nội dung. Nó cho phép ngƣời

sử dụng tra cứu ảnh dựa vào màu sắc, hình dạng và
kết cấu. Các thuộc tính trực quan có đƣợc từ các ảnh tự giữa các bins màu đƣợc xem
xét khi tính toán tính tƣơng tự. Đặc trƣng texture đƣợc biểu diễn với độ thô, tƣơng
phản. Đặc trƣng hình dạng đƣợc mô tả bằng diện tích, hình dáng tròn, độ lệch, hƣớng
trục chính và tập các bất biến moment đại số.
1.5.2. Hệ thống Photobook
Hệ thống này đƣợc phát triển ở viện kỹ thuật Massachusetts. Nó cho phép
ngƣời sử dụng tra cứu ảnh dựa trên màu sắc, hình dạng và kết cấu. Hệ thống này
cung cấp một tập các thuật toán đối sánh gồm: Euclidean, mahalanobis, vector
space angle, histogram, Fourier peak, và wavelet tree distance nhƣ


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status