Lý thuyết Nhận dạng đối tượng trên hình ảnh - pdf 12

Link tải luận văn miễn phí cho ae
MỤC LỤC

LỜI NÓI ĐẦU 3
Tóm tắt 4
1. Giới thiệu 4
Hình 1a: Hình ảnh vật liệu cần nhận dạng 5
Hình 1b: Hình ảnh khuôn mặt con người cần nhân dạng 6
2. Một số phương pháp nhận dạng 6
Hình 2: Những màu sắc khác nhau cho thấy các kết cấu/loại vật liệu. 7
4. Một số kết quả thực nghiệm 8
4.1. Kết quả trên điểm chuẩn LFW 8
Hình 3: Chứng minh tác dụng của kỹ thuật điểm chuẩn LFW. 8
Hình 4: Mặt so sánh kết quả nhận dạng trên tiêu chuẩn LFW. 9
Bảng 1: Hiệu suất nhận dạng trên các số liệu Multi-PIE. 10
4.2 Kết quả trên Flickr Materials Database 10
Bảng 2: Kích thước, số lượng các cụm và số trung bình chức năng cho mỗi hình ảnh 11
4.3 Kết quả trên PIE-Multi 12
TÀI LIỆU THAM KHẢO 13

LỜI NÓI ĐẦU
Do những hạn chế về kiến thức môn học, Anh văn, trong tiểu luận “Nhận dạng đối tượng trên hình ảnh” được tổng hợp từ hai bài báo: Exploring Features in a Bayesian Framework for Material Recognition; Face Recognition with Learning-based Descriptor không thể giới thiệu tất cả các kết quả đã nghiên cứu ở trên mà chỉ giới thiệu nội dung cơ bản sau:
Cấu trúc tiểu luận như sau:
Phần 1: Tóm tắt
Phần 2: Giới thiệu lại vài khái niệm cơ bản cần trong bài báo, các thể hiện tổng thể tối thiểu của nhận dạng hình ảnh, hay các phương pháp nhận dạng mới với kết quả qua một số thực nghiệm cụ thể.
Phần 3: Trình bày một số kết luận dựa trên các kết quả thực nghiệm.
tui xin chân thành Thank TS Nguyễn Đăng Bình đã giảng dạy và hướng dẫn tận tình khi phụ trách môn học Lý thuyết nhận dạng. Dù đã cố gắng nhưng kiến thức có hạn tiểu luận không thể tránh khỏi những sai sót, tui mong nhận được ý kiến đóng góp của Thầy và các anh chị học viên lớp cao học Khoa học Máy tính khóa 2009 để tui có thể hoàn chỉnh tiểu luận này, đồng thời định hướng nghiên cứu tiếp trong tương lai.

Học viên
Nguyễn Mạnh Cường


NỘI DUNG
Tóm tắt
Vấn đề nhận dạng hình ảnh con người hay hình ảnh các loại vật liệu, ví dụ: thủy tinh, kim loại, vải, nhựa hay gỗ, từ một hình ảnh một chiều. Không giống như các nhiệm vụ nhận dạng ở tầm nhìn máy tính, rất khó để tìm kiếm tốt, các chức năng đáng tin cậy mà có thể cho biết loại vật chất. Đã có nhiều phương pháp được giới thiệu như chiến lược sử dụng một bộ giàu thấp và mức trung bình chức năng nghi nhận khía cạnh khác nhau của vật chất xuất hiện, mô hình Latent Dirichlet Allocation (aLDA) kết hợp các chức năng này theo khuôn dạng Bayesian và tìm hiểu một sự kết hợp tối ưu các chức năng, phương pháp tiếp cận của chúng tui mã hóa các-cấu trúc vi mô của đối tượng theo phương pháp mã hóa mới. Không giống như trước đây được thiết kế thủ công các phương pháp mã hóa (ví dụ, LBP hay SIFT), chúng tui sử dụng kỹ thuật học không có giám sát để tìm hiểu một bộ mã hóa từ các ví dụ huấn luyện, tự động có thể đạt được sự cân bằng rất tốt giữa phân biệt và bất biến phân biệt. Sau đó, chúng tui áp dụng PCA để có được một mô tả đối tượng nhỏ gọn. Kết quả thử nghiệm cho thấy hệ thống mới thực hiện sự nhận dạng vật chất khá tốt trên một cơ sở dữ liệu vật liệu mẫu.
1. Giới thiệu
Nhận dạng chất liệu là một khía cạnh quan trọng của nhận dạng. Phải tương tác với nhiều loại vật liệu cơ bản và liên tục đánh giá sự xuất hiện của chúng trong hình ảnh. Ví dụ, khi tiếp xúc một hình ảnh hay chất lượng vật liệu ảnh hưởng quyết định cuối cùng. Vì vậy, rất có giá trị để xây dựng một hệ thống nhận dạng hình ảnh có thể suy ra tính chất vật liệu từ hình ảnh.
Vấn đề nhận dạng các tài liệu từ các bức ảnh đã được giải quyết chủ yếu là trong bối cảnh dự toán phản xạ. Sự xuất hiện hình ảnh của một bề mặt phụ thuộc vào nhiều yếu tố - những điều kiện chiếu sáng, cấu trúc hình học của các mẫu bề mặt tại một số quy mô không gian, và các tính chất phản xạ bề mặt, thường đặc trưng bởi chức năng phân phối hai hướng phản xạ (BRDF) [24] và các biến thể của nó [9, 16, 26]. Một số kỹ thuật đã được phát triển mà có thể ước tính các thông số của một mô hình BRDF từ một bộ ảnh, theo giả định hạn chế của ánh sáng, hình học và các thuộc tính vật chất [10, 11]. Chẳng hạn, nhận dạng khuôn mặt đã thu hút nhiều nỗ lực nghiên cứu [1, 3, 4, 5, 6, 8, 12, 13, 14, 15] do sự tiến bộ của kí hiệu nhận dạng cục bộ [17, 21, 23, 25, 27, 29, 31, 32] và nhu cầu ngày càng cao của thực tế ứng dụng, chẳng hạn như mặt gắn thẻ vào máy tính để bàn [33] hay các Internet1.
Ở đây, tập trung vào nhận dạng mức cao hình ảnh loại vật liệu: như con người, thủy tinh, kim loại, vải, nhựa hay gỗ. Các tính chất phản xạ của vật liệu thường được tương quan với thể loại cao cấp của nó (ví dụ như thủy tinh thường là mờ và gỗ thường có màu nâu), và trong công việc này, sẽ khai thác những đặc tính tương quan. Tuy nhiên, điều quan trọng là chỉ ra rằng chỉ biết các tính chất phản xạ của một bề mặt không đủ để xác định loại vật liệu. Ví dụ, một thực tế là một bề mặt mờ là không cho biết nếu nó được làm bằng nhựa, sáp hay thủy tinh.

Hình 1a: Hình ảnh vật liệu cần nhận dạng

Hình 1b: Hình ảnh khuôn mặt con người cần nhân dạng
2. Một số phương pháp nhận dạng
Những yêu cầu này đưa đến một vấn đề đầy thử thách. Hiện nay, phương pháp tiếp cận dựa trên mô tả [5, 13, 34] đã được chứng minh là xác định điểm thay mặt trên hình ảnh là hiệu quả với nhất hiệu suất tốt nhất [35, 36, 37]. Ahonen et al. [38] đề xuất sử dụng các biểu đồ mẫu nhị phân cục bộ (LBP) [23] để mô tả vi điểm cấu trúc của hình ảnh. LBP mã hóa mức độ cường độ tương đối giữa mỗi pixel và điểm ảnh lân cận. Nó là bất biến để thay đổi thuộc về trắc quang đơn điệu và có thể được chiết xuất có hiệu quả. Kể từ khi LBP là mã hóa bởi một thiết kế thủ công, nhiều LBP tương tự [34, 14, 40] đã được đề xuất để cải thiện LBP gốc. SIFT [21] hay Histogram của Gradient (HOG) [17] là các loại kí hiệu nhận dạng hiệu quả bằng cách sử dụng mã hóa thủ công. Các yếu tố nguyên tử trong các kí hiệu nhận dạng có thể được xem như là mã lượng tử của các gradients hình ảnh. Về cơ bản, phương pháp mã hóa khác nhau và miêu tả phải cân.
Tuy nhiên, các phương pháp mã hóa bị hai nhược điểm. Một mặt, phương pháp mã hóa tối ưu là rất khó khăn. Thông thường, sử dụng nhiều điểm ảnh theo ngữ cảnh (kích thước vector) có thể tạo ra một mã số phân biệt hơn. Nhưng nó không dễ để tự thiết kế một phương pháp mã hóa và xác định kích thước để đạt được sự cân bằng codebook hợp lý giữa nhận diện đúng và tính thô trong một không gian vào lớn. Một số mã hiếm khi có thể xuất hiện trong hình ảnh khuôn mặt thực tế. Nó có nghĩa là các biểu đồ mã kết quả sẽ được ít hơn và ít thông tin, làm giảm khả năng mô tả biệt thức.
Nhận dạng loại vật liệu cao cấp trong các hình ảnh khác với các vấn đề cũng như các đối tượng nghiên cứu của nhận dạng. Mặc dù đôi khi được nhận dạng đối tượng tiên đoán của thể loại vật chất, một lớp các đối tượng có thể được làm bằng vật liệu khác nhau (xem hình 2) và các lớp khác nhau của các đối tượng có thể được làm bằng chất liệu tương tự (xem hình 1). Vì vậy, nhiều tiến bộ gần đây trong nhận dạng đối tượng như hình dạng ngữ cảnh [2], phát hiện đối tượng [7] và chuyển giao nhãn [19] có thể không được áp dụng để nhận dạng tài liệu. Trong thực tế, hầu hết các đối tượng hệ thống nhận dạng dựa vào vật chất bất biến chức năng và có xu hướng bỏ qua các thông tin vật liệu hoàn toàn.

6Zpiy87It98171y
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status