ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ DƯƠNG HOÀNG HUYÊN
MỘT SỐ KỸ THUẬT
TÌM KIẾM ẢNH THEO NỘI DUNG
TRONG CƠ SỞ DỮ LIỆU ĐA PHƯƠNG TIỆN LUẬN VĂN THẠC SĨ
Mã số : 1.01.10
LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS ĐẶNG VĂN ĐỨC
Hà Nội - 2005 Mục lục
Mục lục 1
Các thuật ngữ và các từ viết tắt 3
Danh sách các hình trong luậ 4
Mở ầu 5
Chương 1 7
Tổng quan về cơ sở dữ liệương tiện 7
1.1 Các khái niệm cơ bản 7
1.2 Nguyên lý thiết kế ương tiện 8
2.5 Kết luận 56
Chương 3 58
ặt và thử nghiệm 58
3.1 Tìm kiếm ảnh dựặc trưng màu 58
3.1.1 Phương pháp dùng biểồ màu cục bộ 58
3.1.2 Phương pháp dùng biểồ màu toàn cục 62
3.1.3 Phương pháp dùng moment màu 62
3.2 Tìm kiếm dựặc trưng texture sử dụng ma trậồng hiện 66
3.3 Tìm kiếm dựặc trưng hình dạng sử dụng các moment bất biến 69
Kết luận 72
Tài liệu tham khảo 73
Tiếng Việt 73
Tiếng Anh 73
Các thuật ngữ và các từ viết tắt
CBIR Content-Based Image Retrieval
Hình 2.5 Khoảng cách dạng toàn phương 31
Hình 2.6 Biểồ màu của 3 ảnh A, B, C 32
Hình 2.7 Khoảng cách hai ảnh A và B 34
Hình 2.8 Khoảng cách hai ảnh A và C 35
Hình 2.9 Khoảng cách hai ảnh B và C 35
Hình 2.10 ảnh D sau khi xoay 900 36
Hình 2.11 Ví dụ về ồ thị 38
Hình 2.12 Phương pháp xây dựồ thị 39
ồ thị ối có trọng số 39
Hình 2.14 Tậược có giá trị nhỏ nhất củồ thị 40
Hình 2.15 ảnh trước và sau khi chuyển thành ảnh xám 42
Hình 2.16 Một số texture tiêu biểu 43
Hình 2.17 Ví dụ ma trậồng hiện 44
Hình 2.18 Ví dụ phương pháp mẫu nhị phân cục bộ 47
Hình 2.19 Ví dụ hàm tương quan tự ộng 48
Hình 2.20 Ví dụ biểu diễn hình dạng theo vùng 53
Hình 3.1 Kết quả thực nghiệm phương pháp LCH với lưới 16?16 61
Hình 3.2 Kết quả thực nghiệm phương pháp LCH với lưới 8?8 61
Hình 3.3 Kết quả thực nghiệm phương pháp GCH 65
Hình 3.4 Kết quả thực nghiệm phương pháp moment màu 65
Hình 3.5 Kết quả thực nghiệm ma trậồng hiện với d(0,1) 68
Hình 3.6 Kết quả thực nghiệm ma trậồng hiện với d(1,1) 68
Hình 3.7 Kết quả thực nghiệm moment bất biến 71
mảnh giấy nhỏều này thường hay bị mất thông tin, hoặc thông tin dễ bị mờ.
Xu thế gầế giới người ta cho rằện tử ngày càng phát
triển trong tương lai. Người sử dụng sẽ dùng các thiết bị ện tử ể ghi chép và
lưu trữ các ghi chú cá nhân. Mặc dù có nhiều ghi chép có thể chuyể
ASCII bằng kỹ thuật phân tích chữ viết tay, nhưng có rất nhiều ghi chú không thể
thực hiệược bởi vì các ghi chú thường chứa cả các nét loằng ngoằng hay các
biểồ khối.
Các kiểu dữ liệu liệỉ là một phần trong rất nhiều hình thức biểu
hiện của dữ liệu phát sinh tự nhiên trong các ứng dụng khác nhau. Từ những dữ
liệu mới phát sinh trên, ta thấy rằng các CSDL truyền thống không thể quản lý
các kiểu dữ liệượần phải có có một hệ thống quản lý tất cả các
loại dữ liệương tiệược hình thành.
Trong khuôn khổ của luận vột số vấề cơ bản của
một hệ quản trị ương tiện chẳng hạn các khái niệm, kiến trúc hệ
thống và mô hình dữ liệương tiệập trung nghiên cứu và cài
ặt thử nghiệm một số phương pháp tìm kiếm theo nội dung trên dữ liệ
phương tiện, cụ thể là dữ liệu ảnh.
Chương 1
Tổng quan về cơ sở dữ liệương tiện
1.1 Các khái niệm cơ bản
Dữ liệu Media là các kiểu thông tin hoặc biểu diễn của các kiểu thông tin như các
kí tự, ảnh, audio và video. Multimedia là tập hợp các kiểược sử dụng
với nhau. Hệ quản trị cơ sở dữ liệương tiện (Multimedia DataBase
Management System - MMDBMS) là một hệ thống giúp người dùng thao tác trên
các dữ liệu media một cách thích hợp và hiệu quả. Các thao tác cơ bản của hệ
quản trị CSDL thường là chèn, cập nhật, xóa và tìm kiếm mộối tượng trong
sơ ồ nguyên lý tổ chức lai.
Cả ều có những ưu và nhượểm riêng. Nguyên lý tự trị
hỏi phải tạo ra các thuật toán và cấu trúc dữ liệu cho mỗi media riêng và cần
phải có kỹ thuật kết nối giữa các dữ liệu khác nhau. Ngược lại tổ chức dữ liệu
theo nguyên lý tự trị có thể dẫn tới thời gian xử lý nhanh. Hơn nữa, trong nhiều
trường hợp cấu trúc dữ liệu và thuật toán cho kho dữ liệu cụ thể ồn tại,
nguyên lý tự trị là một lựa chọn tốt.
Hình 1.1 Sơ ồ nguyên lý tự trị
Hình 1.2 Sơ ồ nguyên lý thống nhất
Hình 1.3 Sơ ồ nguyên lý tổ chức lai
Ngược lại với nguyên lý tự trị, nguyên lý thống nhấỏi chúng ta tìm ra cấu
trúc dữ liệể có thể lưu trữ thông tin về ảnh, video, audio, tài liệu ,
ềỏi phải khảo sát nội dung mỗi loại thông tin và cố gắưa ra các
phần chung củỉ số hóa trên các phầợi thế của
nguyên lý thống nhất là dễ ặt và thuật toán thường chạy nhanh. Trong công
nghiệp, nguyên lý thống nhấược sử dụng rộết bị chú
giải (metadata). Bất lợi là chú giải thườược tạo một cách thủ công. Tiến
trình tạo ra bằng tay thường mất nhiều thời gian và kinh phí. Hơn nữa một số
thông tin có thể bị mất nếu ngôn ngữ chú giảầủ ể mô tả
mọi khía cạnh của nội dung. Ví dụ, ngôn ngữ chú thích nội dung ảnh có thể làm
mất thông tin của từểm ảnh. Tương tự, ngôn ngữ chú thích âm thanh có
thể làm mất thông tin về ộ và tần số tín hiệu tại một số ểm.
Nguyên lý tổ chức dữ lai tận dụược các lợi thế của hai kiến trúc trướ
hạn chế ược các bất lợi của nó. Giả sử ta muốn tạo ra một MMDBMS có các
kiểu M1, , Mn. Ta sẽ chia các kiểu thành 2 tập hợp: những kiểu media có sẵn và
Hình 1.4 Kiến trúc tổng quát của MMDBMS
Trong thao tác tìm kiếm, ngườưa ra truy vấn thông qua giao diện người
dùng. Truy vấn có thể là mộặc dữ liệược nhập vào thông qua
các thiết bị ngoại vi. Giao diện ngườễối
tượng trong CSDL, người dùng có thể chọn mộối tượể làm truy
vấn. Nếối tượng trong truy vấặc trưng chính của
ối tượược trích chọn và gởến server thông qua khối truyền thông.
Khối chỉ số hóa và tìm kiếối tượng tương tự nhất và gởi
ối tượến giao diện người dùng thông qua khối truyền thông, giao
diện người dùng sẽ trình diễối tượ
1.3.2 Mô hình dữ liệu
Mô hình dữ liệu trong CSDL cung cấp một ngôn ngữ mô tả tính chất của dữ liệu
ể lưu trữ và tìm kiếm. Ngôn ngữ này phải cho ngườị
chèn, xóa, sửổi và tìm kiếối tượng trong CSDL. Mô hình dữ liệ
phương tiện nắm bắt các tính chấộủa dữ liệương tiện và
cung cấp các dạng cơ bảể phát triển các công cụ sử dụng dữ liệương
tiện. Các tính chấể ối tượng tạo ra dữ liệương tiện,
các mối liên hệ giữối tượng và các tính chất củối tượng. Các tính chất
ộng của dữ liệu có thể là sự tương tác giữối tượối
tượng. Các mô hình dữ liệu phương tiện phảứng các yêu cầu cơ bản như
sau:
- Mô hình dữ liệu phải có khả ở rộối tượng mới có thể
ược bổ sung.
- Mô hình dữ liệu phải có khả ểu diễn các kiểu media cơ bản và các mối
quan hệ không gian và thời gian củối tượng.
- Mô hình dữ liệu phải cho phép lưu trữ và tìm kiếm hiệu quả.
Một mô hình dữ liệu tổng quát thể hiện trong hình 1.5. Tầối tượng chỉ rõ các
mối quan hệ về không gian, thời gian và sự tích hợp giữối tượng. Tầng
các kiểu media chứa các kiểu media chung như text, image, audio và video. Tại
ràng. Truy vấn nhiều loại là vì người dùng có thể ặc tả truy vấn trong nhiều
cách khác nhau. Truy vấn là không rõ ràng bởi vì người dùng có thể chỉ biết
những gì mà họ thấy nhưng không mô tả một cách chính xác hoặc các thông tin
cần thiếượị
Tìm kiếm là một thao tác rất quan trọng trong các hệ quản trị CSDL, trong
MMDBMS thông thường có hai dạng tìm kiếm: tìm kiếm bằặc tả và tìm
kiếm theo mẫu. Giao diện người dùng cần phải hỗ trợ hai phương pháp tìm
kiếm này. Tìm kiếm bằặc tả là người dùng chỉ ra các từ khóa và các
tham số mô tả ặc trưng hoặc các thuộc tính chính của thông tin cần thiết.
Có hai loại truy vấn hỗ trợ cho các thao tác tìm kiếm bằặc tả
- Truy vấn dựa vào metadata: metadata là các dạng thuộc tính của các mục dữ
liệu trong CSDL ví dụ nó có thể là tên tác giả và ngày tạo lập của mộối tượng
tài liệu, hoặc có thể là tên file dữ liệu.
- Truy vấn dựa vào chú thích: chú thích là các chuỗản mô tả nội dung của
một mục dữ liệu. Truy vấn là các từ khóa hoặc là các chuỗản, Việc tìm
kiếm dựa vào tính chính xác giữa nội dung truy vấn và các chú thích.
ối với tìm kiếm bằng mẫu, giao diện ngườặc tả truy vấn với các kiểu
media khác nhau hoặc kết hợp của các kiểu dữ liệu media. Truy vấưa ra một
ối tượng mẫu và hệ thống sẽ ối tượng tương tự vớối
tượng mẫện người dùng phải hỗ trợ các chứập dữ liệu
ể người dùng mô tả các mẫu, chẳng hạn như microphone, camera, scanner.
Tuy nhiên, ngườể sử dụối tượồn tại trong CSDL
ể làm truy vấể ượều này, giao diện phải có chứễn
ối tượười dùng có thể chọn mộối tượ
trình diễể làm truy vấn. Một lý do nữể giao diện phải hỗ trợ chứ
trình diễười dùng nhiều khi không biết chính xác những gì họ
muốn, họ chỉ có thể nhận ra nó khi họ thấứễn sẽ
hiển thị tất cả hoặc là một số ối tượng, ngườẽ chọn ra một
ối tượng thích hợể làm truy vấn.
Một vấề quan trọng trong giao diệấề trình diễn các kết quả truy
thấp bao gồm âm sắc, phân phối tầng sốặc trưng mức thấp
của ảnh bao gồm phân phối màu, kết cấu bề mặt, hình dạối tượng và các
mối quan hệ ặc trưng mức thấp của video bao gồm tham số
thời gian và một số ặc trưng giống như ảiểm thuận lợi củặc trưng
mức thấp là nó có thể ược trích chọn một cách tự ộng.
ặc trưng mức cao cố gắng nhận dạng và hiểối tượng. Ngoại trừ nhận
dạản và tiếng nói, rấể có thể nhận dạược các mẫu audio và
ối tượng trực quan khác.
ọặc trưng, các kỹ thuật chỉ số hóa giúp tổ chứặc
trưể tìm kiếm hiệu quả. Mỗối tượng có thể có nhiềặc trưể biểu
diễn và mỗặc trưng lại có nhiều tham sốần phải có cơ chế chỉ số hóa
tốể tổ chứặc trưng này.
Thao tác tìm kiếm trong dữ liệương tiện thường dựa vào tính tương tự
thay vì tìm kiếm chính xác giữa các mục trong CSDL. Tính tương tự ược tính
toán dựặc trưng và thuộọn. Tuy nhiên, sự thích hợp
của kết quả tìm kiếm là nh giá chủ quan của con ngườầu chính
củộ ương tự là giá trị tương tự ược tính phải phù hợp nhận xét của con
người.
1.4 Cơ sở dữ liệu ảnh
ảnh số có một vị trí vượt trội so với các dữ liệu media khác như video, audio,
ống như dữ liệược sử dụng rộ
trong các ngành công nghiệp giải trí và tin tức), ảnh là một phần quan trọng
trong nhiềực như nghệ thuật, lịch sử, y tếầu khí, dự báo thời
tiết v.ảnh số ất quan trọng các hoạộng của con người
như nông nghiệp, quản lý rừng, khoa họất, quy hoạị, xa hơn nữa
ể thao và giải trí. Trước khi giới thiệu về CSDL ảnh, chúng tôi giới thiệu
khái quát một số CSDL truyền thống.
1.4.1 Các cơ sở dữ liệu truyền thống
ịột cách không hình thức CSDL quan hệ là một bảng gồm các cột và
các dòng, mỗược gọi là một bộ, mỗi cột gọi là một thuộc tính, mỗi thuộc