Luận văn thạc sĩ công nghệ thông tin nghiên cứu các đặc trưng về hình thái và màu sắc trong truy hồi ảnh - Pdf 23


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
_________________ NGUYỄN PHÁT LỘC

NGHIÊN CỨU CÁC ĐẶC TRƯNG
VỀ HÌNH THÁI VÀ MÀU SẮC TRONG
TRUY VẤN ẢNH
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
Mã số: 60.48.02.01
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS ĐỖ NĂNG TOÀN

ĐỒNG NAI - 2012 LỜI CẢM ƠN
Đầu tiên tôi xin chân thành cảm ơn đến Ban Giám Hiệu và tập thể
Thầy Cô trong khoa Công Nghệ Thông Tin – Trường Đại Học Lạc Hồng đã
quan tâm tổ chức tận tình giảng dạy và tạo môi trường thuận lợi cho

dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.

Tác giả luận văn Nguyễn Phát Lộc TÓM TẮT LUẬN VĂN

Tên đề tài luận văn: NGHIÊN CỨU CÁC ĐẶC TRƯNG VỀ HÌNH THÁI
VÀ MÀU SẮC TRONG TRUY VẤN ẢNH.

DANH MỤC BẢNG BIỂU VÀ HÌNH ẢNH ii
PHẦN MỞ ĐẦU 1
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN TRUY VẤN
ẢNH 9
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH 9
1.1.1. Xử lý ảnh là gì? 9
1.1.2. Các vấn đề cơ bản trong xử lý ảnh 16
1.2. TRUY VẤN ẢNH 24
1.2.1. Giới thiệu 24
1.2.2. Các cách tiếp cận trong truy vấn ảnh 30
1.2.2.1. Truy vấn ảnh dựa vào chú thích ( annotation, key word) 30
1.2.2.2. Truy vấn ảnh dựa vào nội dung (CBIR) 30
1.2.2.3. Truy vấn ảnh theo ngữ nghĩa 33
1.2.3. Một số hệ thống truy vấn ảnh thông dụng 34
Chƣơng 2: TRUY VẤN ẢNH DỰA VÀO ĐẶC TRƢNG HÌNH THÁI
VÀ MÀU SẮC 37
2.1. CÁC ĐẶC TRƢNG ĐƢỢC SỬ DỤNG ĐỂ TRUY VẤN ẢNH 37
2.1.1. Các đặc trưng về màu sắc 37
2.1.1.1. Lược đồ màu (histogram) 44
2.1.1.2. Vector liên kết màu (Color Coherence Vector) 47
2.1.1.3. Đặc trưng tự tương quan màu (AutoCorrelogram) 50
2.1.2. Các đặc trưng về hình thái 54
2.1.2.1. Lược đồ hệ số góc (Edge Direction Histogram) 54 2.1.2.2. Vector liên kết hệ số góc (Edge Direction Coherence
Vector) 56
2.2. MỘT SỐ KỸ THUẬT TRUY VẤN ẢNH 59
2.1.1 Truy vấn theo màu sắc 59
2.1.1.1. Truy vấn theo lược đồ màu ( histogram) 59

DANH MỤC CÁC TỪ VIẾT TẮT
STT
Từ viết tắt
Nội dung/Diễn giải
01
1-D
One-dimensional
02
2-D
Two-dimensional
03
3-D
Three-dimensional
04
ASCII
American Standard Code
for Information Interchange
05
CSDL
Cơ Sở Dữ Liệu
06
CBIR
Content Based Image Retrieval
07
CAD
Computer Aided Design
08
CGA
Color/Graphics Adapter
09

18
IBM
International Business Machines
19
JPG
Joint Photographic Group
20
L*u*v
Mô hình màu L*u*v
21
L*a*b
Mô hình màu L*a*b
22
L*C*h
Mô hình màu L*C*h
23
MTM
Mô hình màu MTM
24
MMM
Mediator Markov Model
25
MRI
Magnetic Resonance Imaging
26
NNFIR
Nơron Netwrok based Flexible Image
Retrieval
27
OBIR

YIQ
Mô hình màu YIQ
DANH MỤC HÌNH ẢNH
Hình 1.1 Hệ thống truy vấn ảnh của Google 3
Hình 1.1.1.1 Các bước cơ bản trong một hệ thống xử lý ảnh 9
Hình 1.1.1.2 hệ thống truy vấn ảnh QBIC của IBM 11
Hình 1.1.1.3 hệ thống truy vấn ảnh VISUALSEEK 12
Hình 1.1.1.4 hệ thống truy vấn ảnh WEBSEEK 13
Hình 1.1.1.5 hệ thống truy vấn ảnh BLOBWORLD 14
Hình 1.1.1.6 hệ thống truy vấn ảnh VIRAGE 15
Hình 1.1.2.1 Biểu diễn ảnh với độ phân giải khác nhau 17
Hình 1.1.2.2 Ví dụ về nắn chỉnh biến d
ạng
19
Hình 1.2.1 Hệ thống tìm kiếm thông tin trực quan thế hệ mới
27
Hình 1.2.2.2 Thống kê lựa chọn đặc trưng của một số hệ thống truy vấn ảnh 31
Hình 2.1.1 Hệ màu RGB 40
Hình 2.1.2 Hệ màu CMY 41
Hình 2.1.3 Hệ màu HSI 43
Hình 2.1.4 Không gian màu HSI 43

Hình 2.1.3.1 Minh họa 2 ảnh giống nhau về lược đồ màu và lược đồ hệ số góc 63
Hình 3.2.1.1 Minh họa 2 ảnh có lược đồ màu giống nhau 89% 65
Hình 3.2.1.2 minh họa 2 ảnh có vector liên kết màu giống nhau 75% 66
Hình 3.2.1.3 minh họa 2 ảnh có đặc trưng Correlogram giống nhau 75% 66
Hình 3.2.1.4 minh họa 2 ảnh có lược đồ hệ số góc giống nhau 88% 67
Hình 3.2.1.5 minh họa 2 ảnh có Vector liên kết hệ số góc giống nhau 78% 67
Hình 3.2.1.6 Giải thuật và các bước trong modun truy vấn ảnh dựa vào lược
đồ màu 68
Hình 3.3a Giao diện chính của chương trình 72
Hình 3.3b Chọn thư mục chứa hình ảnh để truy vấn ảnh 73
Hình 3.3c Cập nhật đường dẫn thành công 74
Hình 3.3.1.1a Truy vấn ảnh theo màu xanh dương 74
Hình 3.3.1.1b Kết quả truy vấn ảnh theo màu xanh dương 75
Hình 3.3.1.1c Kết quả truy vấn ảnh theo màu vàng 75
Hình 3.3.1.2a Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 70% 76
Hình 3.3.1.2b Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 90% . 77
Hình 3.3.1.2c Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 100% 77

-1-

PHẦN MỞ ĐẦU

Việc sử dụng hình ảnh trong giao tiếp của con người là hầu như không mới
, tổ tiên của chúng ta sống trong hang động đã vẽ hình ảnh trên các bức tường

kích thích lớn hơn nữa để khai thác các hình ảnh kỹ thuật số. Số hình ảnh có
sẵn trên web gần đây đã được ước tính là từ 10 đến 30 triệu tetrabyte. Xử lý
ảnh là lĩnh vực nghiên cứu đang phát triển không ngừng bởi tính trực quan
sinh động cũng như khả năng áp dụng vào thực tế lớn. Hiện xử lý ảnh đang
giành được nhiều sự quan tâm của các nhà nghiên cứu trong và ngoài nước.
Trong xử lý ảnh, truy vấn ảnh có thể nói là lĩnh vực đòi hỏi sự nghiên cứu
tổng hợp như: nghiên cứu xử lý ảnh để rút trích các đặc trưng, áp dụng các
tính toán toán học cao cấp để xác định mức độ tương đồng giữa hai ảnh và sự
tổ chức sắp xếp chỉ mục cho cơ sở dữ liệu ảnh. Chính vì thế truy vấn ảnh là
lĩnh vực nghiên cứu đem lại nhiều thú vị. Hơn nữa, cùng với sự phát triển của
phần mềm và phần cứng, khối lượng ảnh phát triển không ngừng và ngày
càng lớn. Một số lượng lớn các ảnh đang được sử dụng ở trong thư viện ảnh
số và trên web. Vì vậy nhu cầu tìm kiếm ảnh là một nhu cầu tất yếu. Hiện tại,
truy vấn ảnh ứng dụng trong khá nhiều lĩnh vực như: quản lý nhãn hiệu logo,
truy bắt tội phạm, ứng dụng trong y khoa, quân sự… bởi vì nó mang tính trực
quan cao cho người sử dụng.
Vấn đề truy vấn ảnh trong Cơ Sở Dữ Liệu (CSDL) ảnh được đưa ra từ cuối
năm 1970 của thiên niên kỷ trước và có nhiều cách giải quyết khác nhau. Cho
đến ngày nay đã có rất nhiều hệ thống truy vấn ảnh (cả thương mại lẫn thực
nghiệm) đã và đang được phát triển. Hiệ nay có hai dạng CSDL ảnh để truy
vấn là: CSDL ảnh tĩnh và CSDL ảnh động (ảnh video…).
Trong nghiên
cứu này, tôi chỉ xin xem xét đến phạm vi ảnh tĩnh.
-3- Hình 1.1: Hệ thống truy vấn ảnh của Google

được sử dụng trong một trong hai cách . Thứ nhất, hình ảnh ở phía trước của
máy ảnh có thể được so sánh với bản ghi cơ sở dữ liệu một cá nhân để xác
minh danh tính của mình . Trong trường hợp này, chỉ có hai hình ảnh phù
hợp, các nhà khoa học gọi đó là quá trình gọi CBIR . Thứ hai, toàn bộ cơ sở
dữ liệu có thể được tìm kiếm để tìm thấy những hình ảnh gần nhất phù hợp .
Đây là một ví dụ đích thực của CBIR . Các nghiên cứu và phát triển các vấn
đề trong CBIR bao gồm nhiều chủ đề, chia sẻ với xử lý hình ảnh chính thống
và phục hồi thông tin. Một số quan trọng nhất là:
- Nhu cầu của người sử dụng hình ảnh 'sự hiểu biết và hành vi tìm kiếm
thông tin.
- Xác định các cách thức thích hợp để mô tả nội dung hình ảnh.
- Chiết xuất các tính năng như vậy từ hình ảnh thô.
- Cung cấp lưu trữ nhỏ gọn cho các cơ sở dữ liệu hình ảnh lớn .
- Phù hợp với hình ảnh truy vấn và được lưu trữ trong một cách phản ánh
tương tự như con người bản án.
- Hiệu quả truy cập hình ảnh được lưu trữ theo nội dung.
- Cung cấp các giao diện có thể sử dụng con người để các hệ thống CBIR
Căn cứ tình hình nêu ra, cũng như nhu cầu thực tế để luận giải vì sao cần
phải thực hiện đề tài này
Trong lĩnh vực phòng chống tội phạm cảnh sát sử dụng thông tin trực
quan để xác định những người hoặc để ghi lại những cảnh của tội phạm để
-5-

làm bằng chứng trong quá trình thời gian, những hồ sơ này chụp ảnh trở thành
một kho lưu trữ có giá trị. Tại Anh, nó được phổ biến thực hành để chụp ảnh
tất cả những người bị bắt giữ và lấy dấu vân tay của họ . Bức ảnh này sẽ được
lưu với các hồ sơ chính cho người liên quan, mà trong một hệ thống hướng

nhân trong cách thiết kế phương pháp tiếp cận công việc của họ, hình ảnh sử
dụng nhiều thiết kế trước đây trong các hình thức của hình ảnh, hình ảnh và
đồ họa, cũng như các đối tượng và thông tin hình ảnh khác từ thế giới thực, để
cung cấp nguồn cảm hứng và hình dung sản phẩm cuối cùng. Phác họa 2-D,
3-D mô hình hình học được sử dụng để trình bày ý tưởng cho các khách hàng
và các đồng nghiệp khác. Ngoài ra còn có một nhu cầu để đại diện cho các
hàng may mặc.
Các bức ảnh trong xuất bản và quảng cáo hình ảnh được sử dụng rộng
rãi trong ngành công nghiệp xuất bản, để minh họa cho cuốn sách và bài viết
trên các tờ báo và tạp chí. Nhiều nhà xuất bản tờ báo quốc gia và khu vực duy
trì thư viện ảnh của riêng mình, hoặc sẽ sử dụng những người có sẵn từ Hiệp
hội Báo chí, Reuters và các cơ quan khác. Các bộ sưu tập ảnh sẽ được lập chỉ
mục và nộp theo, thông thường, các nhóm chủ đề rộng (ví dụ như cảnh địa
phương, các tòa nhà hoặc tính cách cũng như hình ảnh bao gồm quốc gia và
quốc tế chủ đề). Ngày càng có nhiều, phương pháp lưu trữ và truy cập điện tử
xuất hiện, cùng với sự phát triển trong các phương pháp tự động sản xuất tờ
báo, giúp cải thiện tốc độ và tính chính xác của quá trình phục hồi. Quảng cáo
và chiến dịch quảng cáo phụ thuộc rất nhiều vào vẫn còn và di chuyển hình
ảnh để quảng bá các sản phẩm hoặc dịch vụ. Sự phát triển của thư viện ảnh
thương mại cổ phần, chẳng hạn như hình ảnh Getty và Corbis, phản ánh bản
chất sinh lợi của ngành công nghiệp.
Hình ảnh kiến trúc và thiết kế kỹ thuật được sử dụng trong kiến trúc để
ghi lại các dự án hoàn thành, bao gồm cả ảnh chụp nội thất và ngoại thất của
các tòa nhà cũng như các tính năng đặc biệt của thiết kế. Theo truyền thống,
những tấm ảnh này sẽ được lưu trữ như là bản in hoặc định dạng trượt, số dự
án và tên truy cập, có lẽ, và được sử dụng để tham khảo các kiến trúc sư trong
việc đưa ra các bài thuyết trình cho khách hàng và cho mục đích giảng dạy.
-7-
-8-

Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn
lựa chọn đề tài: "Nghiên cứu các đặc trưng về hình thái và màu sắc trong
truy hồi ảnh ". Bố cục của luận văn bao gồm phần mở đầu, ba chương chính,
phần kết luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức
như sau:
- Phần mở đầu gồm 03 chương:
+ Chương 1: Khát quát về xử lý ảnh và các bài toán truy vấn ảnh.
Chương này trình bày về truy vấn ảnh và các hướng tiếp cận. Tình hình
nghiên cứu trong và ngoài nước về lĩnh vực truy vấn ảnh cũng như các thuận
lợi, khó khăn và thách thức của việc giải bài toán truy vấn ảnh.
+ Chương 2: Nghiên cứu các đặc trưng truy vấn ảnh dựa vào đặc trưng
hình thái và màu sắc của ảnh. Chương này trình bày các đặc trưng về màu sắc
và các kỹ thuật như : Lược đồ màu (histogram); Vector liên kết màu (Color
Coherence Vector); Đặc trưng tự tương quan màu (AutoCorrelogram). Cùng
với các đặc trưng về hình thái như: Lược đồ hệ số góc (Edge Direction
Histogram); Vector liên kết hệ số góc (Edge Direction Coherence Vector);
truy vấn kết hợp các đặc trưng bằng đại số BOOl và trong số để truy vấn ảnh
cần tìm.
+ Chương 3: Phân tích thiết kế và giới thiệu chương trình ứng dụng
truy vấn ảnh dựa vào đặc trưng hình thái và màu sắc của ảnh.
-
Phần kết luận tóm lược các kết quả đã đạt được và nêu rõ đóng góp của
khóa luận, đồng thời định hướng một số hướng nghiên cứu tiếp theo trong thời
gian sắp tới và tài liệu tham khảo.



Hình 1.1.1.1 Các bước cơ bản trong một hệ thống xử lý ảnh

Con người thu nhận thông tin qua các giác quan, trong đó thị giác
đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của
phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ
và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai
trò quan trọng trong tương tác người máy. Quá trình xử lý ảnh được xem như
là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả
đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết
luận.
Thu nhận Tiền xử lý

Trích chọn
đặc điểm

Hậu xử lý Hệ quyết định

Đối sánh rút
ra kết luận Lưu trữ
-10-

thể truy vấn ảnh theo màu sắc, kết cấu, hình dạng hay thậm chí là theo từ
khóa. Trên thế giới hiện nay có các hệ thống truy vấn ảnh như sau:
Hệ thống Query Based Image Content (QBIC) là hệ thống truy vấn dựa
trên sự phác thảo do IBM phát triển. Người sử dụng xây dựng một phác
thảo, vẽ ra và lựa chọn màu cùng kết cấu dựa theo ảnh truy vấn. Các đặc
trưng màu sử dụng là giá trị màu trung bình trong không gian RGB. Các đặc
trưng về hình dạng sử dụng là dạng tròn, độ lệch tâm và hướng của trục
chính. Hệ thống chỉ mục xây dựng dựa vào cấu trúc cây R
*
Tree. Độ đo
-11-

tương đồng về màu trung bình là:
d
2
avg
(x,y)=(x
avg
-
y
avg
)
t
(x
avg
-y
avg

truy vấn, trước tiên người dùng phải phác họa một số vùng trên ảnh.

Hình 1.1.1.3 hệ thống truy vấn ảnh VISUALSEEK
Sau đó chọn màu cho mỗi vùng, đồng thời xác định vị trí, độ lớn của
vùng. Hệ thống sẽ sử dụng hàm so khớp sau để tìm các hình giống với ảnh
truy vấn d(c
q
,c
t
)=(c
q
-c
t
)
t
A(c
q
-c
t
), trong đó c
q
,c
t
là hai tập màu của hai ảnh
và A=(a[i,j]) là ma trận độ tương đồng của các màu.
Hệ thống WebSeek là hệ thống truy vấn ảnh trên web theo danh mục ảnh
cho trước và sử dụng phép biến đổi wavelet: sưu tập ảnh sau đó phân lớp ảnh,
tạo chỉ mục và cuối cùng là tìm kiếm và hiển thị.
-13-




2



















để tìm kiếm trong chủ đề tương ứng ảnh giống nhất.
Hệ thống BlobWorld là hệ thống truy tìm theo ảnh mẫu dựa trên việc
rút trích các dữ liệu điểm nguyên thủy cùng các đặc tính giống nhau về
màu sắc, kết cấu và hình dạng. Màu sắc sẽ được biểu diễn dưới dạng
histogram 218 màu, kết cấu đặc trưng bởi sự tương phản và tính không thẳng
đứng; còn các đặc trưng hình dạng tính theo vùng với trọng tâm và hướng.
Ảnh truy vấn theo sự phác thảo của các vùng riêng biệt. Hàm đo sự
tương đồng là d(h


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status