luận văn thạc sĩ nhận dạng ảnh mặt người sử dụng mạng nơron - Pdf 24



ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT&TT

TRẦN XUÂN TỨ



ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CNTT&TT
TRẦN XUÂN TỨ
NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON

Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS ĐỖ NĂNG TOÀN
Tôi xin chân thành cảm ơn Thầy giáo PGS.TS Đỗ Năng Toàn đã tận
tình chỉ dạy và hướng dẫn tôi trong suốt thời gian nghiên cứu hoàn thành luận
văn. Để có kết quả như ngày hôm nay công lao của các Thầy, Cô giáo là vô
cùng to lớn. Tôi xin chân thành cảm ơn các Thầy, Cô giáo Viện Công nghệ
thông tin và Khoa Công nghệ thông tin - Đại học Thái Nguyên đã tận tình
giảng dạy, trang bị những vốn kiến thức và kinh nghiệm quý báu để tôi có
được kết quả tốt nhất trong học tập.
Tôi xin bày tỏ lòng biết ơn sâu sắc đến gia đình, bạn bè và đồng nghiệp
đã luôn giúp đỡ, động viên để tôi hoàn thành tốt chương trình học và đề tài
nghiên cứu của mình.

Thái Nguyên, ngày 02 tháng10 năm 2011 Trần xuân Tứ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
i

MỤC LỤC
Trang
Trang phụ bìa
Lời cam đoan
Mục lục i
Danh mục các ký hiệu, các chữ viết tắt ii
Danh mục các bảng iii
Danh mục các hình vẽ, đồ thị iv

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ii

Danh mục các ký hiệu, các chữ viết tắt
LDA (Linear Discriminant Analysis): Phương pháp phân tách tuyến tính
LMS (Least Mean Square): Phương pháp bình phương trung bình tối
thiểu
ORL (Olivetti Research Laboratory, Surrey University): Cơ sở dữ liệu
ảnh dùng trong luận văn
PCA (Principal Components Analysis): Phương pháp phân tích thành
phần chính

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
iii

Danh mục các bảng
Bảng 3.1. Các module chính của chương trình 56


Hình 1.10. Ảnh sau khi biến đổi theo LDA 22
Hình 1.11. Sự liên thông 23
Hình 1.12. Phép dãn ảnh nhị phân 26
Hình 1.13. Phép co ảnh nhị phân 27
Hình 1.14. Phép dãn ảnh tổng quát dựa theo phép cộng Minkowski 30
Hình 1.15. So sánh các kết quả của hai phép co ảnh 32
Hình 1.16. Ảnh sau khi xử lý hình thái 34
Hình 2.1. Mô hình nơ ron sinh học 37
Hình 2.2. Một số dạng hàm kích hoạt của nơron 39
Hình 2.3. Mô hình một nơ-ron 42
Hình 2.4. Các thành phần cơ bản của mạng nơron nhân tạo 43
Hình 2.5. Mạng truyền thẳng một lớp 45
Hình 2.6. Mô tả cấu trúc của mạng nơ ron truyền thẳng nhiều lớp 46
Hình 2.7. Mạng một lớp có nối ngược 46
Hình 2.8. Mạng nhiều lớp có nối ngược 47
Hình 2.9. Mạng nơron l lớp 49
Hình 3.1. Ảnh gốc được bổ sung ảnh gương 53
Hình 3.2. Ảnh gốc trong bộ ảnh ORL 55
Hình 3.3. Giao diện chính của chương trình 57
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1

Phần mở đầu
- Đặt vấn đề:
+ Giới thiệu tổng quan về đề tài
Trong luận văn này trình bày khái quát về xử lý ảnh, các phương pháp
trích chọn đặc trưng. Mạng nơron và sử dụng mạng Nơron trong bài toán
nhận dạng ảnh mặt người.
+ Lý do chọn đề tài
Hiện nay, cùng với sự phát triển như vũ bão của công nghệ thông tin nói

mặt người sử dụng mạng Nơron” là một việc làm không chỉ có ý nghĩa khoa
học và còn mang đận tính thực tiễn nhất khi thực tế đang đặt ra những yêu cầu
đòi hỏi.
- Nội dung nghiên cứu
+ Mục tiêu nghiên cứu và tính cấp thiết của đề tài
Đề tài nghiên cứu các phương pháp trích chọn đặc trưng, nghiên cứu về
mạng nơron và ứng dụng thuật toán lan truyền ngược để giải bài toán nhận
dạng ảnh mặt người .
Tính cấp thiết của đề tài: Hiện nay tình trạng bất ổn về an ninh, chính trị
và nạn khủng bố trên thế giới ngày càng phức tạp do vậy vấn đề nhận dạng
người dùng trong các hệ thống bảo mật, nhận dạng người trên các bằng lái xe,
hộ chiếu, nhận dạng người trong các hệ thống tương tác người-máy, trong
lĩnh vực giải trí… càng trở nên quan trọng và cấp thiết. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3

+ Phạm vi nghiên cứu và ứng dụng
Nghiên cứu các ứng dụng của mạng nơron trong bài toán nhận dạng ảnh
mặt người. Từ dó cài đặt chương trình phân công nhiệm vụ trong hệ thống
nhận dạng mặt người.
Trong khuôn khổ của đề tài chỉ tập trung nghiên cứu cơ sở lý thuyết và cài
đặt thử nghiệm chương trình trên máy tính.
+ Ý nghĩa khoa học
Tìm hiểu nhận dạng ảnh mặt người sử dụng mạng Nơron, phục vụ ứng
dụng trong thực tế như vấn đề an ninh, nhận dạng người dùng trong các hệ
thống bảo mật, nhận dạng người trên các bằng lái xe, hộ chiếu, nhận dạng
người trong các hệ thống tương tác người-máy, trong lĩnh vực giải trí . . .
+ Phương pháp nghiên cứu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5

Chương 1: khái quát về xử lý ảnh và trích chọn đặc trưng
1.1 Khái quát về xử lý ảnh
1.1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh
- Xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan
trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Hình 1.1. Quá trình xử lý ảnh.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong không gian và nó có thể xem như một hàm n biến P(c
1
, c
2
, ,

1.1.2 Thu nhận và biểu diễn ảnh
- Thu nhận
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng. Các thiết bị thu nhận ảnh có 2 loại chính ứng
với 2 loại ảnh thông dụng Raster, Vector.
Các thiết bị thu nhận ảnh thông thường Raster là camera các thiết bị thu
nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc
được chuyển đổi từ ảnh Raster.

Lưu tr


Thu nhận ảnh

(Scanner,
Camera,Sensor)
Tiền xử


Trích chọn

đ
ặc điểm

Hệ quyết định

Đối sánh
rút
ra kết luận
Hậu

BMP
PCC
.
.
.DIB

Cửa sổ
Thay đổi
Paint
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8 + Mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ dễ dàng cho
hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìm
kiếm… Theo những yêu cầu này kỹ thuật biểu diễn vector tỏ ra ưu việt hơn.
Trong mô hình vector người ta sử dụng hướng giữa các vector của điểm
ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu nhận
trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster
thông qua các chương trình số hoá
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và
chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster. Do vậy,
những nghiên cứu về biểu diễn vectơ đều tập trung từ chuyển đổi từ ảnh
Raster.
Analysis) là một kỹ thuật thống kê hữu ích trong các ứng dụng nhận dạng mặt
người và nén ảnh, đồng thời đây cũng là một kỹ thuật phổ biến cho việc tìm
kiếm các mẫu trong không gian dữ liệu có số chiều lớn.
Mục đích của phương pháp phân tích này có thể diễn đạt ngắn gọn như
sau: Ảnh gốc có kích thước 112×92 (10304 điểm ảnh). Những ảnh này cần
được rút gọn sao cho lượng thông tin dùng để biểu diễn ảnh đó giảm đi, đồng
thời không làm mất những đặc điểm quan trọng nhất của khuôn mặt.
Ảnh gốc cần 10304 giá trị để biểu diễn trong khi ảnh biến đổi chỉ cần 49
giá trị. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10

* Cơ sở toán học
- Lý thuyết thống kê
Các nhà thống kê thường quan tâm đến việc lấy mẫu trên một tập dữ liệu.
Ví dụ về cuộc bầu cử, tập dữ liệu là toàn bộ dân số trong một đất nước, trong
khi đó mẫu là một tập con của dân số nhà thống kê muốn đánh giá.
Một vấn đề lớn của thống kê học là thông qua phương pháp đánh giá một
mẫu của dân số, kết quả thống kê cho phép đánh giá được xu hướng chính của
toàn bộ dân số.
Xét một tập ví dụ X = [1 2 4 6 12 15 25 45 68 67 65 98]. Chỉ số dưới của
ký hiệu X được dùng để trỏ tới một số cụ thể trong tập. Ví dụ X
3
trỏ tới số thứ
ba trong X với giá trị là 4. Lưu ý rằng X
1
là số đầu tiên trong X. Ngoài ra ký
hiệu n còn được sử dụng để chỉ tổng số các phần tử trong tập X.



(
−1
)

(
1.2
)

Phương sai là một hàm đo khác về sự trải rộng của dữ liệu trong một tập.
Thực tế nó gần như giống hoàn toàn với độ lệch chuẩn:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11



=
∑ (


−

)



(
−1
)

−

)(


−

)


(
−1
)

(
1.4
)

Tương tự, công thức tính hiệp phương sai được viết như sau:

(
,
)
=
∑ (


−

)(


)(


−

)
ta suy ra cov(X,Y) = cov(Y,X).
Hiệp phương sai chỉ đánh giá được quan hệ giữa hai chiều. Nếu dữ liệu có
nhiều hơn hai chiều, có thể có nhiều hơn một giá trị hiệp phương sai được
tính. Ví dụ, từ một tập dữ liệu ba chiều (x, y, z) ta có thể tính cov(x,y), cov(y,z)
và cov(z,x). Với một tập dữ liệu n chiều, sẽ có
!
(

)
!∗
giá trị hiệp phương sai
khác nhau.
Các giá trị hiệp phương sai giữa tất cả các chiều khác nhau được tính toán
rồi đưa vào một ma trận.
Ma trận hiệp phương sai của một tập dữ liệu n chiều là:

×
= 
,
= 

,


 ℎườ 
2 3
2 1
× 
1
3
=
11
5

 ê 
2 3
2 1
× 
3
2
=
12
8
= 4×
3
2


Hình 1.5. Ví dụ vector thường và vetor riêng
Trong trường hợp thứ nhất, vector kết quả không phải là một bội số của
vector gốc, trong khi đó ở trường hợp thứ hai, vector kết quả bằng đúng 4 lần
vector gốc. Vector 
3
2

× 
6
4
=
24
16
= 4 ×
6
4


Hình 1.6. Ví dụ về sự ổn định của vector riêng đối với việc lấy tỉ lệ
Giá trị riêng có quan hệ chặt chẽ với vector riêng. Thực tế là trên hình 1.5
đã xuất hiện một giá trị riêng. Trong cả hai ví dụ trên, số lần vector gốc được
tăng lên sau khi nhân với ma trận vuông luôn cố định, số lần này là 4. Vậy 4
là giá trị riêng ứng với vector riêng đó. Không cần biết bội số nào của vector
riêng đã được lấy trước khi đem nhân với ma trận vuông, vector kết quả nhận
được luôn bằng 4 lần vector gốc (hình 1.6).
Hiện nay có rất nhiều thư viện toán học hỗ trợ việc tìm các vector riêng và
giá trị riêng của các ma trận, ví dụ gói phần mềm newmat trên trang web
hay các bộ công cụ trong thư viện lập trình của
MATLAB.
* Phương pháp PCA
Phương pháp phân tích thành phần chính cho phép xác định các mẫu
trong một tập dữ liệu và biểu diễn dữ liệu theo cách có thể làm nổi bật được
sự giống nhau và khác nhau giữa các mẫu. Vì các mẫu có thể rất khó tìm ra
trong dữ liệu nhiều chiều (do không thể biểu diễn trực quan bằng đồ họa), nên
PCA là một công cụ hữu hiệu để phân tích dữ liệu. Phương pháp này bao gồm
một số bước cơ bản sau:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

tính được n vector riêng và giá trị riêng, p vector riêng đầu tiên được chọn,
khi đó dữ liệu cuối cùng chỉ còn p chiều.
Tiếp theo cần xác lập một vector đặc trưng, thực chất là tên gọi của một
ma trận các vector. Vector này được xây dựng bằng cách lấy các vector riêng
muốn giữ lại, rồi đặt chúng theo các cột để tạo thành ma trận:
_Đặ_ư=
(






)

(
1.7
)

Bước 6: Xác định tập dữ liệu mới
Bước này là bước cuối cùng trong PCA đồng thời là bước đơn giản nhất.
Sau khi các thành phần (vector riêng) được chọn để giữ lại trong dữ liệu và
thiết lập vector đặc trưng, tiến hành chuyển vị vector và nhân vào phía trái tập
dữ liệu gốc đã chuyển vị.
Dữ_liệu_cuối = Vector_Đặc_trưng  Dữ_liệu_điều_chỉnh
trong đó:
 Vector_Đặc_trưng là ma trận với các vector riêng trong các cột đã
chuyển vị sao cho chúng nằm theo các hàng, với vector riêng ý nghĩa
nhất nằm trên cùng.
 Dữ_liệu_điều_chỉnh là dữ liệu đã được điều chỉnh theo giá trị trung


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Trích đoạn Mô hình mạng nơ-ron nhân tạo Thuật toán học lan truyền ngược Bài toán
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status