Một số kỹ thuật đánh giá độ tương tự trong tra cứu tàu cá trên biển - Pdf 40

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Ninh Thị Kim Yến

MỘT SỐ KỸ THUẬT ĐÁNH GIÁ ĐỘ TƯƠNG TỰ
TRONG TRA CỨU TÀU CÁ TRÊN BIỂN

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2016


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

Ninh Thị Kim Yến

MỘT SỐ KỸ THUẬT ĐÁNH GIÁ ĐỘ TƯƠNG TỰ
TRONG TRA CỨU TÀU CÁ TRÊN BIỂN
Chuyên ngành: Khoa học máy tính
Mã số: 60480101

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS ĐỖ NĂNG TOÀN

Thái Nguyên - 2016




Ninh Thị Kim Yến


i

MỤC LỤC
TRANG BÌA PHỤ
LỜI CAM ĐOAN
LỜI CẢM ƠN
MỤC LỤC...................................................................................................................i
CÁC THUẬT NGỮ, TỪ VIẾT TẮT........................................................................iii
DANH MỤC HÌNH MINH HỌA...............................................................................iv
MỞ ĐẦU.......................................................................................................................1
Chương1. KHÁI QUÁT VỀ TRA CỨU ẢNH VÀ BÀI TOÁN TRA CỨU TÀU CÁ
TRÊN BIỂN ..................................................................................................................3
1.1. Khái quát về tra cứu ảnh..................................................................................3
1.1.1. Giới thiệu................................................................................................3
1.1.2. Một số phương pháp tra cứu ảnh............................................................7
1.2. Bài toán tra cứu tàu cá trên biển ....................................................................21
1.2.1. Giới thiệu..............................................................................................21
1.2.2. Cách tiếp cận ........................................................................................26
Chương 2. MỘT SỐ KỸ THUẬT ĐÁNH GIÁ ĐỘ TƯƠNG TỰ ............................27
2.1. Kỹ thuật theo mô hình không gian vector (VSM) .........................................27
2.1.1. Phép so sánh histogram ........................................................................27
2.1.2. Phép so sánh qua giá trị điểm ảnh ........................................................33
2.2. Kỹ thuật theo mô hình k-phần tử kề cận (k-NN)...........................................40
2.2.1. Thuật toán k-NN...................................................................................40
2.2.2. k-NN trong so khớp điểm ảnh..............................................................42
2.3. Kỹ thuật kết hợp ............................................................................................50

QBIC

3

4

Ý nghĩa

nội dung
Query By Image Content Truy vấn theo nội dung ảnh
Commission internationale de l'éclairage - Uỷ ban quốc

CIE

tế về màu sắc
Geographic Information System - Hệ thống thông tin

GIS

địa lý


iv

DANH MỤC HÌNH MINH HỌA

Hình 1.1. Mô hình hệ thống Tra cứu ảnh theo nội dung ..............................................5
Hình 1.2. Không gian màu RGB được trực quan hoá như một hình khối.....................8
Hình 1.3. Mô tả không gian màu HSV..........................................................................9
Hình 1.4. Ví dụ về một số loại kết cấu........................................................................12

MỞ ĐẦU
1. Lý do chọn đề tài
Nhận dạng và xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng
trong thực tiễn như: Hệ thống thông tin địa lý, quân sự, y học, vv..... Đối với
lĩnh vực khoa học quân sự, trong những thập kỷ vừa qua, công nghệ xử lý ảnh
đã thực sự trở thành một lĩnh vực mũi nhọn không thể thiếu.
Thời gian gần đây, tình trạng tàu cá nước ngoài có những hành động
xâm phạm chủ quyền vùng biển Việt Nam ngày càng nhiều và phức tạp.
Tàu cá nước ngoài không chỉ khai thác trái phép hải sản, đưa phương
tiện vào thăm dò tài nguyên biển nước ta, mà còn xuất hiện những hành động
mang tính chất đặc biệt nguy hiểm, dễ gây xung đột vũ trang trên biển như uy
hiếp, vô cớ trấn cướp tài sản của ngư dân Việt Nam.

Một số hình ảnh tàu cá Việt Nam bị tàu cá nước ngoài uy hiếp trên biển


2

Trong các lực lượng thực thi pháp luật trên biển của Việt Nam nói riêng
và trên thế giới nói chung, bài toán nhận dạng các loại tàu cá trên biển luôn
được đặt ra cấp thiết từ nhiều năm qua, giải quyết tốt bài toán này sẽ giúp cho
việc quản lý tình hình an ninh mặt biển được nhanh chóng, chính xác, hiệu
quả... Nhằm đáp ứng bài toán nhận dạng tàu cá, luận văn này sẽ tập trung
nghiên cứu một số kỹ thuật đánh giá độ tương tự trong tra cứu tàu cá trên biển.
2. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của luận văn là các ảnh/video có chứa tàu bao gồm
các loại tàu cá nước ngoài, tàu cá Việt Nam cùng các đặc điểm hình dạng cơ
bản của chúng. Phạm vi nghiên cứu là các ảnh mặt biển vào ban ngày có chứa
một con tàu.
3. Những nội dung nghiên cứu chính

những ảnh thoả mãn một yêu cầu nào đó. Ví dụ, người sử dụng có thể tìm
kiếm tất cả các ảnh về chủ đề về “tàu cá” trong một cơ sở dữ liệu ảnh hoặc
một người sử dụng khác lại muốn phân loại cơ sở ảnh của mình thành các bộ
sưu tập có chủ đề khác nhau. Một ví dụ khác về tra cứu ảnh là một người
muốn tìm tất cả các ảnh tương tự với một bức ảnh mẫu nào đó trong một cơ
sở dữ liệu ảnh.
Trước năm 1990, người ta thường sử dụng phương pháp tra cứu ảnh theo
văn bản (Text Based Image Retrieval). Theo cách này người ta sẽ gán cho
mỗi bức ảnh một lời chú thích phù hợp với nội dung hoặc một đặc điểm nào
đó của ảnh, sau đó việc tra cứu ảnh được thực hiện dựa trên những lời chú
thích này. Phương pháp này khá đơn giản. Phương pháp tra cứu ảnh như trên
còn được gọi là tra cứu ảnh theo từ khóa. Tuy nhiên, việc tra cứu chỉ dựa vào
văn bản đi kèm còn có nhiều nhập nhằng giữa nội dung hiển thị ảnh và nội


4

dung văn bản đi kèm ảnh trong quá trình tra cứu. Bên cạnh đó phương pháp
tra cứu ảnh dựa theo văn bản không thể áp dụng để tra cứu các cơ sở dữ liệu
ảnh có số lượng ảnh lớn và kết quả tra cứu thì mang tính chủ quan và cảm
ngữ cảnh.
Vấn đề tra cứu ảnh đã được nhìn nhận rộng rãi và việc tìm kiếm các
giải pháp cho vấn đề này trở thành một lĩnh vực rất sôi động, thu hút sự
quan tâm của nhiều nhà nghiên cứu và phát triển.
Một trong những phương pháp được nhiều người quan tâm nghiên
cứu hiện nay là phương pháp “Tra cứu ảnh dựa theo nội dung” (Content
Based Images Retrieval - CBIR). Phương pháp tra cứu ảnh theo nội dung ra
đời đã khắc phục được những nhược điểm của phương pháp từ khóa. CBIR là
một lĩnh vực khoa học được phát triển dựa trên cơ sở lý thuyết và ứng dụng
của xử lý ảnh. Hệ thống cho phép người dùng tra cứu các ảnh tương tự trong

trích chọn một đặc điểm nội dung trực quan để xây dựng thành một véc tơ
đặc trưng.
Véc tơ đặc trưng của ảnh mẫu sẽ được so sánh với véc tơ đặc trưng
tương ứng của các ảnh trong cơ sở dữ liệu ảnh. Kết quả của phép so sánh
là một chỉ số đánh giá độ tương tự giữa ảnh mẫu và ảnh lấy ra để so sánh.
Dựa vào chỉ số độ tương tự tính toán được ở trên, hệ thống sẽ sắp xếp các
ảnh tìm được trong cơ sở dữ liệu ảnh theo một sơ đồ đánh chỉ số nào đó. Danh
sách các ảnh tìm được (đã được sắp xếp) được đưa ra đầu ra của hệ thống.


6

Các chức năng chính của một hệ thống tra cứu ảnh dựa vào nội
dung bao gồm:
 Phân tích nội dung của nguồn thông tin và biểu diễn nội dung của các
nguồn thông tin được phân tích phù hợp với sự đối sánh truy vấn của người
sử dụng (không gian của thông tin nguồn được chuyển đổi thành không gian
đặc điểm với mục đích đối sánh nhanh trong bước tiếp theo). Bước này
thường mất nhiều thời gian cho việc xử lý tuần tự các thông tin nguồn (ảnh)
trong cơ sở dữ liệu. Nó chỉ phải làm một lần và có thể làm độc lập.
 Phân tích các truy vấn của người dùng và biểu diễn chúng thành các
dạng phù hợp với việc đối sánh với cơ sở dữ liệu nguồn. Nhiệm vụ của bước
này giống với bướctrước nhưngchỉ đượcáp dụng với những ảnh truy vấn.
 Xác định chiến lược để đối sánh tìm kiếm truy vấn với thông tin được
lưu trữ trong cơ sở dữ liệu. Bước này có thể thực hiện trực tuyến và thực hiện
rất nhanh. Công nghệ đánh chỉ số có thể được sử dụng để nhận dạng không
gian đặc điểm để tăng tốc độ xử lý đối sánh.
 Tạo ra sự điều chỉnh cần thiết trong hệ thống (thường là bằng cách đối
chiếu các tham số trong công nghệ đối sánh) dựa trên phản hồi từ người sử
dụng hoặc những hình ảnh đượctra cứu.

chung và các đặc trưng lĩnh vực cụ thể. Các đặc trưng trực quan chung gồm
màu, kết cấu và hình dạng trong khi các đặc trưng lĩnh vực cụ thể là phụ thuộc
ứng dụng, có thể gồm mặt người và vân tay. Các đặc trưng lĩnh vực cụ thể
bao gồm nhiều tri thức lĩnh vực.
Nói chung, không tồn tại một biểu diễn đơn tốt nhất cho một đặc trưng
đã cho. Với mọi đặc trưng được cho tồn tại nhiều biểu diễn mô tả đặc trưng từ
các viễn cảnh khác nhau.
a) Màu sắc
Mắt người rất nhạy cảm với màu sắc và đặc điểm màu là một trong
những thành phần quan trọng giúp con người có thể nhận biết được hình ảnh.


8

Vì vậy, đặc điểm màu sắc là đặc điểm cơ bản của nội dung ảnh. Đặc điểm
màu sắc có thể cung cấp những thông tin rất hữu hiệu cho việc phân loại ảnh
và chúng cũng rất hữu ích cho việc tra cứu ảnh. Cũng vì thế mà tra cứu ảnh
dựa trên màu sắc được sử dụng rộng rãi trong các hệ thống tra cứu ảnh dựa
trên nội dung. Biểu đồ màu thường được sử dụng để thể hiện những đặc điểm
màu của các ảnh. Mặc dù vậy trước khi sử dụng biểu đồ màu chúng ta cần
phải lựa chọn và xác định kiểu không gian màu và lựa chọn độ đo tương tự.
 Không gian màu
Không gian màu là sự biểu diễn tập các màu, một số không gian màu
được sử dụng rộng rãi trong đồ họa máy tính. Màu sắc thường được xác định
trong không gian màu 3 chiều.
Không gian màu RGB
Không gian màu RGB là không gian màu được sử dụng nhiều nhất cho
đồ hoạ máy tính. Lưu ý rằng R, G và B là viết tắt của các từ đỏ (Red), xanh
lục (Green) và xanh lơ (Blue). Đây là không gian màu cộng: đỏ, xanh lục và
xanh lơ được kết hợp lại để tạo ra các màu khác. Không gian này không đồng



10

phẳng I-Q là một mặt phẳng quay 330 của mặt phẳng U-V. Tín hiệu Y biểu
diễn độ chói của một pixel và là kênh duy nhất được sử dụng trong ti vi đen
trắng. U và V cho YUV và I và Q cho YIQ là các thành phần màu.
Kênh Y được định nghĩa bởi các giá trị năng lượng có trọng số của
R(0.299), G(0.587) và B(0.144). Các không gian màu YUV và YIQ không
là đồng nhất nhận thức. Khi các không gian màu YUV và UIQ được lượng
hoá, mỗi trục được lượng hoá với cùng độ chính xác.
Không gian màu CIE XYZ và CIE LUV
Không gian màu đầu tiên được phát triển bởi CIE là không gian màu
XYZ. Thành phần Y là thành phần độ chói được xác định bởi các tổng có
trọng số của R(0:212671), G(0:715160) và B(0:072169). X và Y là các thành
phần màu. Không gian màu XYZ là không đồng nhất nhận thức. Trong lượng
hoá không gian màu XYZ, mỗi trục được lượng hoá với cùng độ chính xác.
Không gian màu CIE LUV là một biến đổi xạ ảnh của không gian màu
XYZ là đồng nhất nhận thức. Kênh L của không gian màu LUV là độ chói
của màu. Các kênh U và V là các thành phần màu. Vậy, khi U và V được đặt
bằng 0, kênh L biểu diễn một ảnh cấp xám.
Trong lượng hoá không gian LUV, mỗi trục được lượng hoá với cùng độ
chính xác. Với cả không gian màu XYZ và LUV, các lược đồ lượng hoá
thường sử dụng 8 (23), 27 (33), 64 (43), 125 (53) bin.
 Lược đồ màu
Lược đồ màu được xác định bằng một tập các bin, trong đó mỗi bin biểu
thị xác suất của các pixel trong ảnh. Một lược đồ màu H của một ảnh đã cho
được xác định bởi véc tơ: H  H [0], H [1], H [2],..., H [i],...H [ N ], trong đó H [i] là
số các pixel có màu i trong ảnh, i biểu diễn một màu trong lược đồ màu và
tương ứng với một khối con trong không gian màu RGB và N là số các bin

bản, các phương pháp biểu diễn kết cấu có thể được phân ra thành hai loại:
cấu trúc và thống kê.
Các phương pháp cấu trúc, gồm toán tử hình thái và đồ thị kề, mô tả kết
cấu bởi nhận dạng cấu trúc gốc và các luật sắp đặt của chúng. Chúng có chiều
hướng hiệu quả nhất khi được áp dụng với các kết cấu đều.
Các phương pháp thống kê, gồm các kỹ thuật phổ năng lượng Fourier,


12

các ma trận đồng khả năng, phân tích thành phần chính bất biến - trượt, đặc
trưng Tamura, phân rã Wold, trường ngẫu nhiên Markov (Markov random
field), mô hình fractal và lọc đa phân giải như biến đổi Gabor và sóng, mô tả
kết cấu bằng phân bố thống kê của cường độ ảnh.
Trích xuất nội dung ảnh theo kết cấu nhằm tìm ra mô hình trực quan của
ảnh và cách thức chúng được xác định trong không gian. Kết cấu được biểu
diễn bởi các texel mà sau đó được đặt vào một số các tập phụ thuộc vào số kết
cấu được phát hiện trong ảnh. Các tập này không chỉ xác định các kết cấu mà
còn chỉ rõ vị trí các kết cấu trong ảnh. Việc xác định các kết cấu đặc biệt trong
ảnh đạt được chủ yếu bằng cách mô hình các kết cấu như những biến thể cấp
độ xám 2 chiều. Ví dụ về một số loại kết cấu.

Hình 1.4. Ví dụ về một số loại kết cấu

c) Hình dạng
Hình dạng được xem như là một đặc trưng quan trọng trong mô tả các
đối tượng nổi bật trong ảnh và có thể giúp phân biệt giữa hai ảnh.
Bước đầu tiên là sử dụng một phương pháp phân đoạn thích hợp để chia
ảnh thành các vùng. Các kỹ thuật phân đoạn có thể được phân lớp thành ba
loại: dựa vào vùng, dựa vào đường biên và dựa vào pixel. Sau khi ảnh được

các ảnh.
Thu thông tin không gian của các đối tượng trong một ảnh là một quá
trình quan trọng đối với các hệ thống GIS. Quá trình này bao gồm việc biểu
diễn vị trí không gian tuyệt đối và cũng bao gồm vị trí không gian tương đối


14

của các đối tượng. Các thao tác như giao và chồng được sử dụng. Bố cục màu
kết hợp thông tin không gian với thông tin màu xuất hiện trong ảnh và tạo ra
một đặc trưng rất quan trọng trong quá trình tra cứu, gọi là đặc trưng màu –
không gian.
Biểu diễn quan hệ không gian được sử dụng rộng rãi nhất là các xâu 2D
được đề xuất bởi Chang và cộng sự. Nó được xây dựng bởi việc chiếu các ảnh
dọc theo các hướng x và y. Hai tập ký hiệu V và A được định nghĩa trên hình
chiếu. Mỗi ký hiệu trong V biểu diễn một đối tượng trong ảnh. Mỗi ký hiệu A
biểu diễn một loại quan hệ không gian giữa các đối tượng. Do sự biến đổi của
nó, xâu 2DG cắt tất cả các đối tượng dọc theo hình hộp tối thiểu của nó và mở
rộng các quan hệ không gian thành lập hai toán tử không gian. Một tập định
nghĩa các quan hệ không gian cục bộ. Tập còn lại định nghĩa quan hệ không
gian toàn cục, chỉ ra rằng hình chiếu của hai đối tượng là tách rời, nối tiếp
hoặc định vị tại cùng vị trí. Thêm nữa, xâu 2DC được đề xuất để cực tiểu hóa
số các đối tượng cắt. Xâu 2D-B biểu diễn một đối tượng bằng hai ký hiệu, vị
trí cho bắt đầu và kết thúc đường bao của đối tượng. Tất cả các phương pháp
này có thể hỗ trợ ba loại truy vấn. Loại truy vấn 0 tìm tất cả ảnh chứa đối
tượng O1, O2, ...,On. Loại 1 tìm tất cả các ảnh chứa các đối tượng có quan hệ
nào đó giữa chúng nhưng khoảng cách giữa chúng là không đáng kể. Loại 2
tìm tất cả các ảnh có quan hệ khoảng cách nào đó với mỗi ảnh khác.
Thêm với xâu 2D, cây tứ phân không gian và ảnh ký hiệu cũng được sử
dụng cho biểu diễn thông tin không gian. Tuy nhiên, tìm kiếm các ảnh dựa

của các thuật toán phân đoạn loại này là nó trích rút các đường bao từ một số
lượng lớn các ảnh mà không chiếm thời gian và nỗ lực của con người. Tuy
nhiên, trong một lĩnh vực tự nhiên, với các ảnh không có điều kiện tiên quyết,
phân đoạn tự động không luôn luôn tin cậy. Một thuật toán có thể phân đoạn
trong trường hợp này chỉ là các vùng, mà không là các đối tượng. Để thu được
các đối tượng mức cao, nó cần có sự trợ giúp của con người.


16

Samadani và Han đã đề xuất một cách tiếp cận trích rút đường bao được
trợ giúp bởi máy tính, nó kết hợp các đầu vào thủ công từ người sử dụng với
các biên ảnh được sinh ra bởi máy tính. Trong, Daneel và cộng sự đã phát
triển một phương pháp cải tiến của các chu tuyến thiết thực. Dựa trên đầu vào
của người sử dụng, đầu tiên thuật toán sử dụng một thủ tục tham lam để cung
cấp sự hội tụ ban đầu nhanh. Thứ hai, nét ngoài được lọc bằng việc sử dụng
quy hoạch động. Trong, Rui và cộng sự đã đề xuất một thuật toán dựa vào
phân cụm và nhóm trong không gian - màu - kết cấu. Người sử dụng định
nghĩa đối tượng quan tâm là ở đâu, và thuật toán nhóm các vùng thành các đối
tượng có ý nghĩa.
Giá trị đáng chú ý sau cùng đề cập trong phân đoạn là các yêu cầu chính
xác phân đoạn là rất khác nhau cho các đặc trưng hình và các đặc trưng bố
cục. Với các đặc trưng hình, phân đoạn chính xác là mong muốn cao trong khi
các đặc trưng bố cục, một phân đoạn thô có thể là đủ.
1.1.2.2. Tra cứu ảnh dựa vào hình dạng
a) Lược đồ hình dạng
Lược đồ hình dạng là phương pháp giúp cho việc tính toán được dễ dàng
và nhanh trong thi hành. Chúng sử dụng cả sự so sánh về màu sắc và vân. Vấn
đề chính là định nghĩa biến cho lược đồ hình dạng được định nghĩa. Xem như
hình dạng trong ảnh là một vùng những giá trị một trong ảnh nhị phân, trong

việc tính toán, đặc biệt là trong trường hợp lược đồ và ảnh có kích thước lớn.
Hoặc là lược đồ có thể được tiêu chuẩn hoá bởi cách chọn bin với số đếm lớn
nhất là bin đầu tiên. Một vài bin lớn nhất nên được thử vì có thể có sự tồn tại
của nhiễu.
b) Độ so khớp đườngbiên của hình dạng
Thuật toán so khớp đường biên đòi hỏi sự trích rút và trình bày đường
biên của cả ảnh cần truy vấn và ảnh mang ra so khớp. Đường biên có thể
được trình bày bởi một dãy những điểm ảnh hay có thể được xấp xỉ bởi một



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status