ĐỀ XUẤT PHƯƠNG PHÁP NHẬN DẠNG KHUÔN MẶT NGƯỜI VÀ ỨNG DỤNG CHỐNG GIAN LẬN TRONG THI CỬ - Pdf 23

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN THỊ LEN

ĐỀ XUẤT PHƯƠNG PHÁP NHẬN DẠNG KHUÔN MẶT
NGƯỜI VÀ ỨNG DỤNG CHỐNG GIAN LẬN TRONG
THI CỬ

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2014

Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS Phạm Thế Quế

Phản biện 1: PGS. TS Ngô Quốc Tạo
Phản biện 2: PGS. TS Đỗ Năng Toàn

Luận văn đã được bảo vệ trước Hội đồng chấm luận văn
thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông

biến là: Cơ sở dữ liệu AT&T, Cơ sở dữ liệu Yale A, Cơ
sở dữ liệu Yale B
Bài toán nhận dạng khuôn mặt có thể áp dụng rộng
rãi trong nhiều ứng dụng thực tế khác nhau.
1.2 Ứng dụng của đề tài vào cơ sở thực tiễn
Trong đề tài này, tôi tập trung tìm kiếm và đề xuất
một thuật toán hiệu quả nhận dạng khuôn mặt nhằm chống
gian lận trong thi cử .
Do các khó khăn của bài toán nhận dạng khuôn mặt
như: Tư thế góc chụp, sự xuất hiện hoặc thiếu một số
thành phần của khuôn mặt, sự biểu cảm của khuôn mặt, sự
che khuất, hướng của ảnh, điều kiện của ảnh
Vì thế trong luận văn này tôi đưa ra những giả định
và ràng buộc sau làm giảm độ phức tạp của bài toán như
sau:
- Góc ảnh trực diện (frontal) hoặc gần như trực diện,
không bị che khuất (no occlusion)
- Ảnh được chụp trong điều kiện ánh sáng bình
thường.
3

- Cơ sở dữ liệu ảnh nhỏ, khoảng trăm ảnh.
- Ảnh được xét trong luận văn là ảnh số, nghĩa là ảnh
mặt người được chụp từ các thiết bị như máy ảnh số,
camera,…. Luận văn không xem xét các ảnh mặt người
nhân tạo như vẽ, điêu khắc …
1.3 Các phương pháp nhận dạng khuôn mặt
người
1.3.1 Phân tích thành phần chính (PCA)
Phân tích thành phần chính là phương pháp lâu đời

Việc áp dụng mô tả khuôn mặt bằng LBP được
Ahonen và các cộng sự thực hiện năm 2006. Ý tưởng của
5

phương pháp là chia hình hảnh khuôn mặt thành các khối,
sau đó tính toán các histogram tương ứng với các khối.
Cuối cùng kết hợp các histogram này lại với nhau để có
được vector đặc trưng cho khuôn mặt.
1.3.4 Support vector Machines (SVM)
SVM là một phương pháp phân lớp xuất phát từ lý
thuyết học thống kê. Thuật toán SVM lần đầu tiên được
Vladimir Vapnik đề xuất. Sau đó, Corinna Cortes cùng với
Vladimir Vapnik đề xuất hình thức chuẩn hiện nay. SVM
có nhiều tính năng ưu việt so với các phương pháp cổ điển
khác: dễ dàng xử lý, xử lý với tính ổn định cao trên dữ
liệu phức tạp, có thể có số chiều lớn và quan trọng hơn cả
là khả năng xử lý tổng quát
6

1.3.4.1 Các khái niệm nền tảng
1.3.4.2 SVM tuyến tính
1.3.4.3 SVM phi tuyến
1.3.4.4 SVM cho vấn đề nhận dạng đa lớp
1 2 3 4 5 6 7 8
2 4 6
7
4 7
4

Hình 1.1 Cấu trúc 1 cây nhị phân cho nhận dạng khuôn

(Từ ảnh/
Camera)
Phát hiện khuôn
mặt (face
detection)
Trích rút đặc
trưng
(feature
extraction)
Tiền xử lý
(preprocessing)
Nhận dạng
(recognition )
Kết quả
Hình 2.1 Hệ thống nhận dạng khuôn mặt
2.1.1 Phát hiện khuôn mặt (face detection)
Phát hiện khuôn mặt sẽ lấy ra tất cả các khuôn mặt
trong một hình ảnh.
8

2.1.2 Tiền xử lý ảnh (preprocessing)
Bước này nhằm mục đích lọc nhiễu, nâng cao chất
lượng ảnh, trong bước này bao gồm các bước : Căn chỉnh
ảnh, chuẩn hóa ánh sáng
2.1.3 Trích rút đặc trưng ( feature extraction)
Ở bước này một phương pháp trích chọn đặc điểm
như: mẫu nhị phân cục bộ – LBP (hay Gabor wavelets,
Gradient, Discrete Cosine Transform …) sẽ được sử dụng
với ảnh mặt để trích xuất các thông tin đặc trưng cho ảnh,
kết quả là mỗi ảnh sẽ được biểu diễn dưới dạng một


Mục 1.3.1 trong chương này trình bày về phương
pháp PCA.
2.1.6 Các cách kết hợp các phương pháp
2.2 Đề xuất phương pháp nhận dạng kết hợp
LBP-PCA-SVM
Hiện tại có nhiều phương pháp kết hợp để nhận
dạng khuôn mặt như trên đề cập. Trong khuôn khổ luận
văn này, sẽ trình bày về phương pháp nhận dạng mặt
người bằng cách kết hợp ba phương pháp LBP, PCA &
SVM, ứng dụng việc kết hợp ba phương pháp nhận dạng
nhằm chống gian lận trong thi cử.

Hình 2.2 Sơ đồ kết hợp các phương pháp (phương pháp
LBP-PCA-SVM)
11

2.2.1 Áp dụng LBP trích rút đặc trưng & PCA để
giảm số chiều.
Trong luận văn ảnh chia làm 49 khối, mỗi chiều
của ảnh chia làm 7 phần kích thước của ảnh khuôn mặt
trước khi rút đặc trưng cần là 126x147px.
Các bước thực hiện trích rút đặc trưng khuôn mặt:

Hình 2.3 Các bước thực hiện trích rút đặc trưng
2.2.2 Áp dụng SVM phân lớp/nhận dạng
Trong luận văn này sử dụng SVM nhiều lớp với
chiến lược one-vs-one (Theo nghiên cứu của Chih-Wei
Hsu và Chih-Jen Lin [11] chiến lược one-vs-all cho kết
quả không được tốt), sử dụng với hàm nhân là Radial

Tiền xử lý
Trích rút đặc
trưng (LBP)
Kết quả nhận
dạng
Tiền xử lý
SVM nhiều
lớp trên cơ sở
Cây nhị phân
Huấn luyện Nhận dạng

Hình 2.4 Sơ đồ phân lớp/nhận dạng sử dụng SVM 32 8

Hình 2.5 Cây nhị phân với lớp là 40
13

8 4 2 1

Hình 2.6 Cây nhị phân với lớp là 15
2.3 Đánh giá phương pháp

Hình 2.7 Đồ thị tỉ lệ nhận dạng phương pháp PCA và
LDA trên tập AT&T
14

Đối với sinh viên trường thì để lấy tập dữ liệu ảnh
lớn như vậy là rất khó. Sau khi thử nghiệm với phương

92.8%
93.2%
94.2%
95.4%
96.4%
Bảng 2.2 Tỉ lệ nhận dạng theo số lượng ảnh mẫu phương
pháp LBP-PCA- SVM trên CSDL AT&T & Yale A
15

CHƯƠNG 3 - XÂY DỰNG ỨNG DỤNG
CHỐNG GIAN LẬN TRONG THI CỬ DỰA
TRÊN PHƯƠNG PHÁP LBP-PCA-SVM

3.1 Những hiện tượng gian lận phổ biến trong thi cử
Hiện tượng gian lận trong Giáo dục nói chung và
hiện tượng gian lận trong học hộ, thi hộ nói riêng là vấn
đề nan giải và được bàn cãi nhiều đặc biệt là trước – trong
và sau mỗi kỳ thi.
Trong các trường Đại học, Cao đẳng, Trung học
chuyên nghiệp mục đích của việc học hộ là tránh để mất
30% điểm học phần theo quy chế 25 của Bộ Giáo dục.
Việc học hộ thường xảy ra ở các lớp Liên thông, Tại chức
học vào ca tối, các lớp có tình trạng lớp đông, giáo viên
mới
Đối với hiện tượng thi hộ, việc kiểm tra và đối
chiếu học sinh – sinh viên vào dự thi mất rất nhiều thời
gian, đôi khi vẫn bỏ qua được đối tượng thi hộ như trường
hợp anh em thi hộ, hiện tượng tráo ảnh trong thẻ dự thi,
hiện tượng quên thẻ sinh viên….
16

Quy trình thực hiện như sau:
 Bước 1: Thu thập dữ liệu ảnh sinh viên
Trước mỗi kỳ thi mỗi sinh viên sẽ gửi cho nhà
trường ít nhất 3 hình ảnh của khuôn mặt (trạng thái bình
thường, vui vẻ, buồn). Tập tên được gửi có định dạng
MSSV-[1,2,3, …], trong đó MSSV là mã số sinh viên,
sau ký tự “-“ là các số 1, 2, 3 … tương ứng với các ảnh số
1 hoặc 2 hoặc 3 …. Ảnh chụp độ phân giải ít nhất 3Mpx.
Sau khi được xác thực ảnh sẽ được đưa vào cơ sở dữ liệu.
Sinh viên cũng có thể gặp trực tiếp người phụ trách
để thu thập ảnh từ Camera.
 Bước 2: Nhập dữ liệu thi trước mỗi buổi thi
18

Trước mỗi lần thi, người phụ trách sẽ nhập danh
sách thí sinh thi tương ứng với các phòng thi, danh sách
này được nhập từ file Excel và được tải vào máy chủ
(trong chương trình demo này danh sách được lọc theo mã
sinh viên).
 Bước 3: Quy trình tại phòng thi
Tại phòng thi chương trình nhận dạng dựa trên dữ
liệu từ máy chủ gửi xuống.Trước mỗi lần thi cần kiểm tra
hệ thống nhận dạng: camera, ánh sáng Yêu cầu thí sinh
đứng trực diện, ngay ngắn trước Camera. Nếu nhận dạng
thành công thì thí sinh đó được vào thi, nếu nhận dạng 3
lần không thành công thí sinh cần xuất trình thẻ sinh
viên(hoặc chứng minh thư) để cán bộ coi thi đối chiếu.
C
Camera
Ánh sáng Ánh sáng

khuôn mặt
Trích rút đặc
trưng
Tiền xử lý Nhận dạng Kết quả
Truyền dữ liệu Histogram
Hình 3.2 Mô hình hệ thống nhận dạng khuôn mặt
Mô hình hình thực hiện được chia là 2 phần: máy
chủ và các máy trạm. Máy chủ lưu cơ sở dữ liệu khuôn
mặt và dữ liệu thi. Vào mỗi buổi sáng chương trình trên
20

máy chủ sẽ chuyển dữ liệu xuống các máy trạm, đó là
những tập tin có phần mở rộng là LBPH theo mô hình
mạng LAN.
Trong mỗi buổi thi số thí sinh không quá 40 sinh
viên, nên theo mô hình này thì máy chủ gửi dữ liệu về
máy trạm không lớn.
3.3.1 Chương trình trên máy chủ (Server)
Server có chức năng thu thập ảnh và trích rút đặc
trưng. Ảnh thu thập có thể là ảnh tĩnh (từ tập tin hoặc thư
mục), hoặc ảnh chụp từ Camera.

Hình 3.3 Giao diện chương trình Server
21 Hình 3.4 Chức năng thu thập ảnh từ Camera
Sau khi thu thập ảnh, chương trình sẽ trích rút đặc
trưng ảnh theo điều kiện lọc và gửi xuống các máy trạm
(Client). Ở đây điều kiện lọc là theo mã sinh viên (có thể

CĐXD1
Khảo sát thực nghiệm với 35 học sinh của một
lớp học tương ứng với một phòng thi thì tuỳ theo
điều kiện cho kết quả nhận dạng khác nhau:
- Đối với những thí sinh gửi ảnh theo đúng yêu cầu,
ảnh được gửi trong khoảng từ 1 tháng đến 12 tháng


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status