ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
LÊ THỊ THU HẰNG
NGHIÊN CỨU VỀ MẠNG NƠRON TÍCH
CHẬP VÀ ỨNG DỤNG CHO BÀI TOÁN
NHẬN DẠNG BIỂN SỐ XE
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
HÀ NỘI, 2016
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
LÊ THỊ THU HẰNG
NGHIÊN CỨU VỀ MẠNG NƠRON TÍCH
CHẬP VÀ ỨNG DỤNG CHO BÀI TOÁN
NHẬN DẠNG BIỂN SỐ XE
Ngành
: Công nghệ thông tin
Chuyên ngành
: Kĩ thuật phần mềm
Mã số
Xin chân thành cảm ơn các bạn trong khoa Công Nghệ Thông Tin,
Trƣờng ĐH Công nghệ đã giúp đỡ, động viên tôi rất nhiều trong quá trình thực
hiện đề tài.
Em xin chân thành cảm ơn !
Hà nội, tháng 5 năm 2016
Học viên
Lê Thị Thu Hằng
4
MỤC LỤC
LỜI MỞ ĐẦU ................................................................................................ 10
CHƢƠNG 1: MẠNG NƠRON..................................................................... 12
VÀ MẠNG NƠRON TÍCH CHẬP .................................................................. 12
1.1.
Mạng nơron và mạng nơron lan truyền ngƣợc ................................. 12
1.1.1. Giới thiệu về mạng Nơron ................................................................ 12
1.1.2. Kiến trúc mạng truyền thẳng............................................................ 14
1.1.3. Mạng nơron truyền thẳng và thuật toán lan truyền ngƣợc................ 15
1.2.
Mạng nơron tích chập .......................................................................... 23
1.2.1. Định nghĩa mạng nơron tích chập [1] ............................................... 23
1.2.2. Tích chập (convolution) .................................................................... 23
1.2.3. Mô hình mạng nơron tích chập ......................................................... 25
Bảng 1.1. Một số hàm truyền thông dụng ................................................... 14
Bảng 2.1. Quy định biển số cho quân đội. ................................................... 40
7
DANH MỤC HÌNH
Hình 1.1. Cấu tạo một Nơron ....................................................................... 12
Hình 1.2. Mạng truyền thẳng ....................................................................... 15
Hình 1.3. Mạng nơron truyền thẳng nhiều tầng ........................................ 16
Hình 1.4. Ảnh hƣởng của kích thƣớc mẫu .................................................. 21
Hình 1.5. Minh họa tích chập ....................................................................... 24
Hình 1.6. Ảnh mờ sau khi chập.................................................................... 24
Hình 1.7. Ảnh đƣợc phát hiện biên sau khi chập ....................................... 25
Hình 1.8. Mô hình mạng nơron tích chập ................................................... 26
Hình 1.9. Mô hình mạng perceptron nhiều tầng ........................................ 27
Hình 2.1 Ảnh xám và lƣợc đồ xám của ảnh ................................................ 43
Hình 3.1. Mô hình mạng nơron tích chập trong nhận dạng ký tự số ...... 45
Hình 3.2. Minh họa mạng liên kết đầy đủ (full connection)...................... 47
Hình 3.3. Mô hình nhận dạng kí tự số ......................................................... 47
Hình 3.4. Mô hình mạng cho bài toán ......................................................... 48
Hình 3.5. Một số biển không tách đúng ký tự ............................................ 49
8
DANH MỤC TỪ VIẾT TẮT
Từ viết
tắt
Automatic License Plate Number Nhận dạng biển số xe tự động
MNIST
Mixed National Institute of
Standards and
Technology database
Viện liên hợp các quốc gia
Tiêu chuẩn và Công nghệ cơ sở
dữ liệu
OCR
Optical Character Recognition
Nhận dạng ký tự quang học
GPU
Graphics Processing Unit
Khối xử lý đồ họa
9
LỜI MỞ ĐẦU
Mạng Nơron Nhân Tạo -Artificial Neural Network (ANN) là một mạng
có khả năng mô phỏng và học rất hiệu quả. ANN có thể mô phỏng gần nhƣ bất
10
mạng nơron truyền thẳng đặc biệt mà có thể kết xuất các thuộc tính hình học trong một
bức ảnh. Mạng nơron tích chập có thể nhận dạng ảnh có nhiều thay đổi, kết quả nhận
dạng độ chính xác và tốc độ cao. Trong luận văn cao học này, em đi vào nghiên cứu
về mạng nơron tích chập và ý tƣởng của mô hình mạng nơron tích chập trong phân lớp
ảnh (Image Classification), và áp dụng trong việc xây dựng hệ thống nhận dạng biển
số xe tự động
Nội dung bài báo cáo bao gồm 3 chƣơng.
Chƣơng 1: Mạng nơron và mạng nơron tích chập.
Chƣơng 2: Tổng quan về nhận dạng biển số xe.
Chƣơng 3: Áp dụng mạng nơron tích chập trong nhận dạng ký tự
11
CHƢƠNG 1: MẠNG NƠRON
VÀ MẠNG NƠRON TÍCH CHẬP
Mạng nơron và mạng nơron lan truyền ngƣợc
1.1.
1.1.1. Giới thiệu về mạng Nơron
Định nghĩa: Mạng nơron nhân tạo, Artificial Neural Network (ANN) là
một mô hình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ
nơron sinh học. Nó đƣợc tạo nên từ một số lƣợng lớn các phần tử (nơron) kết
nối với nhau thông qua các liên kết (trọng số liên kết) làm việc nhƣ một thể
thống nhất để giải quyết một vấn đề cụ thể nào đó. Một mạng nơron nhân tạo
đƣợc cấu hình cho một ứng dụng cụ thể (nhận dạng mẫu, phân loại dữ liệu,...)
Hàm
bk
Ngƣỡng
Wk
xN
f (.)
Trọng số liên kết
Hình 1.1. Cấu tạo một Nơron
Các thành phần cơ bản của một nơron nhân tạo bao gồm:
• Tập các đầu vào: Là các tín hiệu vào (đầu vào signals) của nơron, các tín
hiệu này thƣờng đƣợc đƣa vào dƣới dạng một vector N chiều.
• Tập các liên kết: Mỗi liên kết đƣợc thể hiện bởi một trọng số liên kết –
Synaptic weight. Trọng số liên kết giữa tín hiệu vào thứ j với nơron k thƣờng
đƣợc kí hiệu là wkj. Thông thƣờng, các trọng số này đƣợc khởi tạo một cách
12
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1]
https://ongxuanhong.wordpress.com/2015/12/29/convolutional-neuralnetworks-la-gi/
Tiếng Anh
[2] http://neuralnetworksanddeeplearning.com/chap6.html
[3] http://neuralnetworksanddeeplearning.com/chap2.html