Đề tài NCKH sinh viên 1 Nhận dạng đối tượng
THÔNG TIN CHUNG VỀ ĐỀ TÀI
1. Tên đề tài: Nhận dạng tổng thể đối tượng
2. Cấp dự thi: Cấp Bộ
3. Nhóm sinh viên thực hiện:
STT Họ tên sinh viên Lớp, khoa Vai trò
1 Lê Đình Trường ĐH Tin K10B, Khoa CNTT-TT Nhóm trưởng
2 Lê Văn Hào ĐH Tin K10B, Khoa CNTT-TT Nhóm viên
3 Lê Ngọc Thanh ĐH Tin K10B, Khoa CNTT-TT Nhóm viên
4. Giáo viên hướng dẫn:
- ThS. Trương Thế Chuyên, Trưởng bộ môn khoa học máy tính, khoa CNTT-TT.
- Đồng hướng dẫn: ThS. Phạm Thế Anh, ThS. Lê Đình Danh, khoa CNTT-TT.
5. Thời gian thực hiện: 6 tháng (từ tháng 11/2010 đến tháng 5/2011).
6. Cơ quan quản lý đề tài: Trường Đại học Hồng Đức.
7. Đơn vị chủ trì đề tài: Khoa công nghệ thông tin và truyền thông
BẢNG CÁC KÍ HIỆU, CHỮ VIẾT TẮT DÙNG TRONG BÁO CÁO
Kí hiệu, chữ viết tắt Được hiểu là
CSDL Cơ sở dữ liệu
SIFT Scale-invariant feature transform
DoG Diffirence of Gaussian
NC Nghiên cứu
Object Recoginition
Đề tài NCKH sinh viên 2 Nhận dạng đối tượng
MỤC LỤC
Mục Tên chương, mục và tiểu mục Trang
Thông tin chung về đề tài 01
Mục lục 02
Mở đầu 03
I Sự cần thiết của đề tài 04
II Mục tiêu của đề tài 04
III Ý nghĩa khoa học, tính thực tiễn và khả năng ứng dụng 04
cần đầu tư nhiều hơn nữa.
Trong vấn đề cụ thể nhận dạng đối tượng thì ngày nay hướng nghiên cứu phổ
biến trên thế giới là việc sử dụng các điểm bất biến (Invarian Feature) trong ảnh làm
đặc trưng (Keypoint) để nhận dạng. Tiêu biểu nhất trong các thuật toán đối sánh sử
dụng keypoint dạng này là thuật toán SIFT (Scale-Invarian Feature Transform, David
Lowe 1999 và 2004), SIFT có thể coi là thuật toán tiền đề cho các ứng dụng cũng
như giải thuật khác về biến đổi đặc trưng bất biến trong ảnh. Các giải thuật đang ứng
dụng trong thực tế khác đều dựa trên hay phát triển theo các nhánh riêng của SIFT.
Các đặc trưng trong SIFT không phụ thuộc vào các phép biến đổi ảnh cơ bản
như xoay, thu phóng, thay đổi độ sáng... nên có thể xem tập các đặc trưng của một
ảnh là thể hiện cho nội dung của ảnh đó. Vì vậy kết quả của việc nhận dạng sẽ có độ
chính xác rất cao và thậm chí có thể khôi phục được đối tượng bị che khuất trong
Object Recoginition
Đề tài NCKH sinh viên 4 Nhận dạng đối tượng
ảnh. Tuy nhiên giải thuật SIFT rất phức tạp trong cài đặt, đòi hỏi thời gian nghiên
cứu và am hiểu nhiều thuật toán thành phần.
Trong phạm vi đề tài, em đã tìm hiểu sâu từng bước của giải thuật SIFT và
thực hiện cài đặt thành công giải thuật và ứng dụng vào nhận dạng đối tượng tùy biến
trong cơ sở dữ liệu đặc trưng được trích chọn từ ảnh.
I. Sự cần thiết của đề tài
Mặc dù được ứng dụng nhiều trên thế giới nhưng trong nước việc tìm hiểu và
cài đặt các thuật toán nhận dạng sử dụng keypoint đang còn hạn chế, hiện tại rất
hiếm các đề tài, công trình nghiên cứu, tài liệu tiếng Việt về vấn đề này. Vì vậy việc
tìm hiểu, hoàn thành cài đặt cơ bản thuật toán là cần thiết.
II. Mục tiêu nghiên cứu
Chúng em thực hiện đề tài với mục tiêu chính là tìm hiểu, nắm rõ thuật toán
SIFT và kĩ thuật dò tìm đặc trưng bất biến. Sau đó, dựa theo những điều tìm hiểu
được, chúng em sẽ cài đặt từng phần của thuật toán và viết tài liệu tiếng Việt cùng mã
nguồn nêu những hiểu biết đầy đủ về giải thuật SIFT.
III. ý nghĩa khoa học, tính thực tiễn và khả năng ứng dụng
b. Lọc và trích xuất các điểm đặc biệt (Keypoint localization): Từ những điểm
tiềm năng ở trên sẽ lọc và lấy ra tập các điểm đặc trưng tốt nhất (keypoints).
c. Gán hướng cho các điểm đặc trưng (Oriented Assignment): Mỗi điểm đặc
trưng sẽ được gán cho một hoặc nhiều hướng dựa trên hướng gradient của
ảnh. Mọi phép toán xử lý ở các bước sau này sẽ được thực hiện trên những dữ
liệu ảnh mà đã được biến đổi tương đối so với hướng đã gán, kích cỡ và vị trí
của mỗi điểm đặc trưng. Nhờ đó, tạo ra một sự bất biến trong các phép xử lý
này.
d. Bộ mô tả điểm đặc trưng (Keypoint Description): Các hướng gradient cục bộ
được đo trong ảnh có kích cỡ cụ thể nào đó trong vùng lân cận với mỗi điểm
đặc trưng. Sau đó, chúng sẽ được biễu diễn thành một dạng mà cho phép mô
Object Recoginition
Đề tài NCKH sinh viên 6 Nhận dạng đối tượng
tả các tầng quan trọng của quá trình bóp méo hình dạng cục bộ và sự thay đổi
về độ sáng.
Tập các điểm đặc biệt thu được thường phụ thuộc rất ít vào các phép biến đổi
cơ bản như xoay, phóng to, thu nhỏ, tăng giảm cường độ sáng, vì vậy có thể xem đây
là các đặc trưng mang tính cục bộ của ảnh. Để đối sánh và nhận dạng hai ảnh thì ta
tìm tập keypoint giống nhau trong hai ảnh, dựa vào hướng và tỉ lệ để có thể biết đối
tượng trong ảnh gốc đã xoay, thu phóng bao nhiêu so với ảnh đem đối sánh. Cách
tiếp cận của thuật toán này dựa vào điểm bất biến cục bộ của ảnh, chúng được trích
xuất ra, được định hướng và mô tả sao cho hai keypoint ở hai vùng khác nhau thì
khác nhau. Tuy nhiên một yếu tố ảnh hưởng không nhỏ đến tốc độ thuật toán là số
lượng các keypoint được lấy ra là không nhỏ. Trung bình một ảnh kích thước 500 x
500 pixels thì sẽ trích xuất được khoảng 1000 điểm (số lượng điểm này phụ thuộc
vào tùy từng ảnh và tham số lọc khác nhau). Số lượng các điểm đặc trưng có một tầm
quan trọng trong vấn đề nhận dạng đối tượng, để nhận dạng một đối tượng nhỏ trong
một ảnh chứa tập hợp các đối tượng hỗn độn thì cần ít nhất 3 điểm đặc trưng giống
nhau để phát hiện và và bóc tách đối tượng.
Đối với vấn đề xây dựng một cơ sở dữ liệu ảnh và thực hiện nhận dạng đối