ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Lưu Xuân Thế
NGHIÊN CỨU CÁC KỸ THUẬT DÒ BIÊN ÁP DỤNG
TRONG TRÍCH CHỌN CÁC BỘ PHẬN KHUÔN MẶT
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI – 2010
§
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Lưu Xuân Thế
NGHIÊN CỨU CÁC KỸ THUẬT DÒ BIÊN ÁP DỤNG
TRONG TRÍCH CHỌN CÁC BỘ PHẬN KHUÔN MẶT
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: ThS. Ma Thị Châu
HÀ NỘI – 2010
LỜI CẢM ƠN
Lời đầu tiên em xin bày tỏ lòng biết ơn tới các thầy, cô giáo trong trường Đại học Công
nghệ - Đại học Quốc gia Hà Nội. Các thầy cô đã dạy bảo, chỉ dẫn chúng em và luôn tạo điều
kiện tốt nhất cho chúng em học tập trong suốt quá trình học đại học đặc biệt là trong thời gian
làm khoá luận tốt nghiệp.
Em xin bày tỏ lòng biết ơn sâu sắc tới cô giáo ThS. Ma Thị Châu, cô đã hướng dẫn em
tận tình trong cả học kỳ vừa qua, cô đã góp ý và chỉnh sửa thường xuyên cho khóa luận của
em.
Tôi cũng xin cảm ơn những người bạn của mình, các bạn đã luôn ở bên tôi, giúp đỡ và
cho tôi những ý kiến đóng góp quý báu trong học tập cũng như trong cuộc sống.
Hà nội, ngày 2010
Chương 4. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN...........................................................34
4.1 Kết luận ...................................................................................................................34
4.2 Hướng phát triển......................................................................................................35
i
Chương 1. GIỚI THIỆU
1.1 Giới thiệu về tìm biên trong nhận dạng khuôn mặt
Kỹ thuật dò biên là bài toán mới chỉ xuất hiện cách đây không lâu, chỉ khoảng vài thập
niên, nhưng đã có rất nhiều nghiên cứu về nó. Các nghiên cứu ban đầu rất đơn giản, ảnh là
đen trắng và chỉ có một khuôn mặt chụp thẳng, sau này mở rộng ra cho ảnh màu, ảnh có
nhiều khuôn mặt với nhiều góc, môi trường xung quanh cũng đi từ đơn giản đến rất phức tạp.
Bài toán phát hiện biên nói chung và phát hiện biên khuôn mặt nói riêng có rất nhiều hướng
để phát triển, nhưng có thể kể ra hai hướng chính sau:
- Thứ nhất là nhận diện (face recognition) một khuôn mặt, tức là giả sử ta có bức ảnh
một khuôn mặt, ta sẽ tìm một bức ảnh có khuôn mặt giống với khuôn mặt trong ảnh. Ứng
dụng của nó là truy tìm tội phạm, các hệ thống an ninh xác đinh dựa vào khuôn mặt.
- Thứ hai là xác định vị trí những khuôn mặt trong một bức ảnh (face detection), các bức
ảnh có thể có nhiều khuôn mặt, có kích thước và góc khác nhau. Ứng dụng của nó như trong
các máy chụp hình có khả năng nhận dạng mặt người để chỉnh độ sáng nơi đó.
Biên là vấn đề chủ yếu trong phân tích ảnh, vì các đặc điểm trích chọn trong quá trình
phân tích ảnh chủ yếu dựa vào biên. Một điểm được gọi là điểm biên nếu ở đó có sự thay đổi
đột ngột về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh.
Về mặt toán học người ta xem biên là nơi có sự thay đổi đột ngột về mức xám, trên cơ
sở đó người ta thường sử dụng hai phương pháp phát hiện biên sau:
- Phương pháp phát hiện biên trực tiếp
- Phương pháp phát hiện biên gián tiếp
i
Xuất phát từ thực tế đó, mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn
biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên, tìm hiểu các kỹ thuật phân
i
Chương 3: Kỹ thuật dò biên được áp dụng
Chương này giới thiệu vào các kỹ thuật dò biên được áp dụng trong chương trình. Bằng
cách sử dụng hàm Gauss để làm trơn ảnh sau đó dùng các kỹ thuật tìm kiếm trực tiếp để đưa
ra 5 kiểu biên khác nhau với một bức ảnh nói chung và khuôn mặt trong chương trình này.
Chương 4: Kết luận và hướng phát triển
Chương này tổng kết lại những gì đã đạt được và chưa đạt được. Từ đó nêu lên những
kết quả hướng tới, hướng nghiên cứu và phát triển tiếp theo.
i
Chương 2. CÁC KỸ THUẬT DÒ BIÊN
2.1 Quy trình phát hiện biên
ảnh đầu vào output
H2.1. Quy trình phát hiện biên
B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu
B2: Làm nổi biên sử dụng các toán tử phát hiện biên.
B3: Định vị biên. Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên
giả xuất hiện do vậy cần loại bỏ biên giả.
B4: Liên kết và trích chọn biên.
2.2 Kỹ thuật phát hiện biên trực tiếp
Phương pháp này chủ yếu dựa vào sự biến thiên độ sáng của điểm ảnh để làm nổi biên
bằng kỹ thuật đạo hàm.
- Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient
Định nghĩa: Gradient là một vector f(x, y) có các thành phần biểu thị tốc độ thay đổi mức
xám của điểm ảnh (theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều) tức:
i
Lọc nhiễu Làm nổi
biên
Định vị biên trích chọn biên
Toán tử (mặt nạ) Sobel
Toán tử Sobel được Duda và Hart [5] đặt ra năm 1973 với các mặt nạ tương tự như của
Robert nhưng cấu hình khác như sau:
Hướng ngang (x) Hướng dọc (y)
Mặt nạ Prewitt
Toán tử Prewitt đưa ra năm 1970 có dạng:
Hướng ngang (x) Hướng dọc (y)
i
Mặt nạ đẳng hướng:
Một mặt nạ khác cũng được nêu như dưới đây gọi là mặt nạ đẳng hướng (Isometric).
Hướng ngang (x) Hướng dọc (y)
Toán tử 4-lân cận (4-Neighbour Operator).
Toán tử 4-lân cận được Chaudhuri và Chandor (1984) nêu ra trong đó mặt nạ có kích
thước 3x3 được thay cho mặt nạ 2x2 của toán tử Robert. Các mặt nạ này được cho:
H3. Mặt nạ 4 lân cận
i
H2.4. Mặt nạ 8 hướng theo Kirsh.
Một vài nhận xét:
Toán tử Prewitt có thể tách sườn tốt hơn toán tử Sobel, trong khi đó toán tử Sobel tách
các sườn trên các đường chéo tốt hơn. Mặt khác, các toán tử Robert và các toán tử 4-lân cận
có nhược điểm là nhạy với nhiễu. Các toán tử Gradient và Sobel giảm nhiễu do tác dụng của
lọc trung bình các điểm lân cận. Như vậy, để đạt được kết quả mong muốn các toán tử
Gradient thường được dùng trước để làm sạch nhiễu.
Các mặt nạ của các toán tử trên có kích thước 2x2 hoặc 3x3 chiều. Các mặt nạ có số
chiều lớn hơn cũng được sử dụng. Ví dụ trong kỹ thuật phát hiện biên người ta dùng mặt nạ
5x5 cho toán tử Sobel:
Toán tử Sobel 5x5.
Các toán tử kể trên đều sử dụng các mặt nạ theo hai chiều (x, y) tức là 4 hướng (-x, y-y,