Một số kỹ thuật tìm kiếm ảnh theo nội dung trong cơ sở dữ liệu đa phương tiện - pdf 25

Link tải luận văn miễn phí cho ae Kết Nối

Trình bày một số vấn đề cơ bản của hệ quản trị CSDL đa phương tiện, đã tiến hành thử nghiệm cài đặt một số phương pháp tìm kiếm theo nội dung (dữ liệu ảnh) trên dữ liệu đa phương tiện
: Luận văn ThS. Công nghệ thông tin -- Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2005
Mở đầu 5
Chương 1 7
Tổng quan về cơ sở dữ liệu đa phương tiện 7
1.1 Các khái niệm cơ bản 7
1.2 Nguyên lý thiết kế CSDL đa phương tiện8
1.3 Kiến trúc hệ thống và mô hình dữ liệu CSDL đa phương tiện 11
1.3.1 Kiến trúc tổng quát11
1.3.2 Mô hình dữ liệu 13
1.3.3 Giao diện người dùng 14
1.3.4 Trích chọn đặc trưng, chỉ số hóa và độ đo tương tự 16
1.4 Cơ sở dữ liệu ảnh 18
1.4.1 Các cơ sở dữ liệu truyền thống 18
1.4.2 Cơ sở dữ liệu ảnh 21
1.4.3 Tìm kiếm ảnh theo nội dung 23
Chương 2 25
Một số kỹ thuật tìm kiếm theo nội dung trong cơ sở dữ liệu ảnh 25
2.1 Kí hiệu mô tả nội dung ảnh 25 2.2 Tìm kiếm ảnh dựa vào đặc trưng màu 26
2.2.1 Không gian màu 26
2.2.2 Lượng tử hóa màu 28
2.2.3 Biểu đồ màu 29
2.2.4 Độ đo khoảng cách của biểu đồ màu 30
2.2.5 Kỹ thuật tìm kiếm ảnh dùng biểu đồ màu 32
2.2.6 Kỹ thuật tìm kiếm ảnh dùng moment màu 40
2.3 Tìm kiếm ảnh dựa vào đặc trưng texture 41
2.3.1 Một số khái niệm về texture 41
2.3.2 Ma trận đồng hiện (co-occurrence matrix) 44
2.3.3 Phương pháp chuỗi texture (texture spectrum methods) 46
2.3.4 Đặc trưng tương quan tự động 48
2.3.5 Các đặc trưng của Tamura 49
2.3.6 Độ đo tương tự của texture 50
2.4 Tìm kiếm ảnh dựa vào đặc trưng hình dạng 50
2.4.1 Moment bất biến 51
2.4.2 Biểu diễn hình dạng dựa vào vùng 52
2.4.3 Kí hiệu mô tả Fourier 54
2.5 Kết luận 56
Chương 3 58
Cài đặt và thử nghiệm 58
3.1 Tìm kiếm ảnh dựa vào đặc trưng màu 58 3.1.1 Phương pháp dùng biểu đồ màu cục bộ 58
3.1.2 Phương pháp dùng biểu đồ màu toàn cục 62
3.1.3 Phương pháp dùng moment màu 62
3.2 Tìm kiếm dựa vào đặc trưng texture sử dụng ma trận đồng hiện 66
3.3 Tìm kiếm dựa vào đặc trưng hình dạng sử dụng các moment bất biến
Kết luận 72
Tài liệu tham khảo73
Tiếng Việt 73
Tiếng Anh 73 Định nghĩa 2.3: Tập M ? E được gọi là tập sánh được trong đồ thị phân đôi
G=(X,Y,E) nếu hai cạnh bất kì trong M không có đỉnh chung.
Định nghĩa 2.4: Tập M được gọi là tập sánh được cực đại trong đồ thị phân đôi G
nếu nó chứa mọi tập sánh được khác trong đồ thị G.
Định nghĩa 2.5: Tập M được gọi là tập sánh được đầy đủ trong đồ thị phân đôi G
nếu mọi đỉnh trong G đều có cạnh nối trong M.
Định nghĩa 2.6: Đồ thị phân đôi được gọi là đồ thị phân đôi có trọng số nếu mỗi
cạnh trong G đều được gán một số thực không âm.
Định nghĩa 2.7: Giá trị của tập sánh được M là tổng trọng số của tất các cạnh có
trong tập sánh được M trong đồ thị phân đôi có trọng số G.
Định nghĩa 2.8: Cho đồ thị phân đôi G, giữa tất cả các tập sánh được cực đại, tập
sánh được có giá trị nhỏ nhất là tập sánh được có giá trị nhỏ nhất, định nghĩa
tương tự đối với tập sánh được có giá trị lớn nhất.
Định nghĩa 2.9: Tập sánh được đầy đủ có giá trị nhỏ nhất là tập có giá trị nhỏ
nhất trong tất cả các tập sánh được đầy đủ trong đồ thị phân đôi G có trọng số.
Hình 2.11 minh họa các định nghĩa trên. Phương pháp Harbin bao gồm ba bước
chính sau đây:
1. Phân chia ảnh thành các vùng với kích thước bằng nhau và tính biểu đồ màu
mỗi vùng.
2. Xây dựng đồ thị phân đôi có trọng số như sau: mỗi vùng chia là một đỉnh trong
đồ thị, mỗi vùng trong ảnh này sẽ kết nối với tất cả các vùng trong ảnh kia, trọng
số của cạnh kết nối giữa hai vùng là khoảng cách của hai vùng đó.
3. Tìm tập sánh được đầy đủ có giá trị nhỏ nhất và xem giá trị của tập sánh được
này là khoảng cách giữa hai ảnh. Để tìm được tập sánh được đầy đủ có giá trị
nhỏ nhất trong đồ thị phân đôi, ta áp dụng thuật toán Hungarian được trình bày
trong [7]. Hình 2.11 Ví dụ về đồ thị phân đôi
Xét ví dụ thể hiện trong hình 2.12, có hai ảnh D và E. Phương pháp Harbin chia
mỗi ảnh D và E thành bốn vùng. Sau đó tính khoảng cách giữa các vùng (hình
2.13), ở đây sử dụng khoảng cách Euclidean và giá trị mỗi cạnh trong phạm vi từ
0 đến 1. Cuối cùng, tìm tập sánh được đầy đủ có giá trị nhỏ nhất trong đồ thị ở
hình 2.13, chúng ta nhận được tập sánh được đầy đủ có giá trị nhỏ nhất thể
hiện ở hình 2.14. Trong hình 2.14, các đường in đậm thể hiện cạnh của tập sánh
được đầy đủ có giá trị nhỏ nhất và Cost = dHarbin(D, E) = w(1, 2)+ w(2, 4)+ w(3,
1)+ w(4, 3) = 0 + 0 + 0.353 + 0.353 = 0.706, giá trị này chính là khoảng cách giữa
hai ảnh D và E.
Nếu sử dụng phương pháp LCH, dLCH(D, E) = w(1, 1) + w(2, 2) + w(3, 3) + w(4, 4)
= 0.353 + 0.707 + 0.353 + 0.612 = 2.025, trong đó w(i, j) là khoảng cách từ vùng
thứ i của ảnh này đến vùng thứ j của ảnh kia. Từ kết quả dHarbin(D, E) < dLCH(D,
E) trong ví dụ trên ta thấy rằng phương pháp Harbin cho kết quả chính xác hơn,
tuy nhiên ta cũng không thể khẳng định được là phương pháp Harbin sẽ chính
xác hơn phương pháp LCH.
Hình 2.12 Phương pháp xây dựng đồ thị phân đôi
Hình 2.13 Đồ thị phân đối có trọng số
Hình 2.14 Tập sánh được có giá trị nhỏ nhất của đồ thị phân đôi
Phương pháp Harbin trong một số trường hợp có thể cho kết quả chính xác hơn
phương pháp LCH. Tuy nhiên, độ phức tạp thời gian tính toán cao hơn rất nhiều
so với phương pháp LCH, hơn nữa phương pháp Harbin chiếm nhiều không gian
lưu trữ hơn. quả thực nghiệm phương pháp
Hình 3.2 Kết quả thực nghiệm phương pháp LCH với lưới 8?8
Từ kết quả thực nghiệm cho thấy, kết quả tìm kiếm phụ thuộc kích thước lưới
chia của ảnh, thông thường khi số vùng chia nhiều thì kết quả tìm kiếm sẽ chính
xác hơn. Vấn đề xác định vùng chia như thế nào để đạt kết quả tìm kiếm tốt
nhất là một vấn đề khó, thông thường dựa trên các kết quả thực nghiệm.
3.1.2 Phương pháp dùng biểu đồ màu toàn cục
Phương pháp tìm kiếm ảnh dựa trên biểu đồ màu toàn cục là một trường hợp
đặc biệt của phương pháp biểu đồ màu cục bộ (khi lưới chia của ảnh trong
phương pháp biểu đồ màu cục bộ là 1?1). Do đó độ phức tạp tính toán GCH
bằng với độ phức tạp tính toán của LCH và bằng O(wh), trong đó w, h là kích
thước của ảnh. Tuy nhiên, GCH cho kết quả tìm kiếm nhanh hơn LCH vì GCH chỉ
tính một lần biểu đồ màu cho mỗi ảnh. Đặt biệt, khi một ảnh xoay lệch so với vị
trí ban đầu, GCH vẫn cho khoảng cách hai ảnh bằng nhau, ngược lại thì LCH có
thể cho khoảng cách khác nhau. Cùng một ảnh mẫu như trong phương pháp
LCH, kết quả tìm kiếm thể hiện trong hình 3.3.
3.1.3 Phương pháp dùng moment màu
Như đ• trình bày trong 2.2.6, các đặc trưng moment màu gồm có: trung bình, độ
lệch chuẩn, và căn bậc ba của phương sai và được định nghĩa tương ứng như
sau: , , , trong đó Pij là giá trị kênh màu thứ i tại điểm ảnh j, Ei là giá trị trung
bình của kênh màu thứ i, ?i là độ lệch chuẩn của kênh màu thứ i, si là căn bậc ba
của kênh màu thứ i, F là tổng số điểm ảnh. Đối với không gian màu RGB số kênh
màu là 3, do đó có tất cả 9 số thực biểu diễn đặt trưng moment màu của ảnh.



Libqp265eQcon99
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status