041_Nghiên cứu và ứng dụng mạng Neutron trong nhận dạng chữ viết tay tiếng Việt - Pdf 63

- 8 -
NGHIÊN CỨU VÀ ỨNG DỤNG MẠNG NEUTRON TRONG NHẬN DẠNG
CHỮ VIẾT TAY TIẾNG VIỆT

Nguyễn Thị Minh Ánh
MSV: 0121792
Email: Cán bộ hướng dẫn: TS. Nguyễn Việt Hà
1. Giới thiệu
Nhận dạng chữ viết tay tiếng Việt là một bài
toán khó và cho tới nay chưa có một lời giải
trọn vẹn nào. Trong bài toán này, chúng ta
không những phải đương đầu với những khó
khăn chung của chữ viết tay mà còn phải giải
quyết những khó khăn riêng đặc thù của tiếng
Việt, đó là: số lượng kí tự rất lớn do hệ thống
dấu tiếng Việt đem lại và việ
c hình thành nhiều
nhóm kí tự rất giống nhau, khó phân biệt. Để
khắc phục những khó khăn này, em đề xuất giải
pháp: chia tập hợp kí tự tiếng Việt thành nhiều
nhóm và xây dựng mô hình đa mạng neuron
tương ứng để nhận dạng.
2. Tổng quan về mạng neuron
Mạng neuron (neural network) là mạng các
phần tử (neuron) kết nối với nhau thông qua
các liên kết (trọng số liên kết) để thực hiện một
công việc cụ thể nào đó.
Để mạng thực hiện được nhiệm vụ này

nhóm có số lượng phần tử lớ
n bằng cách
lấy một ngưỡng khác (lớn hơn ngưỡng ở lần
phân nhóm trước).
4. Mô hình đa mạng neuron áp dụng cho
bài toán
Cấu trúc của hệ thống đa mạng neuron
được xác định dựa trên cấu trúc của bảng phân
nhóm kí tự. Mỗi mạng neuron tương ứng với
một nhóm có nhiều hơn một kí tự. Hệ thống đa
mạng gồm một vài lớp mạng, mỗi lớp lại có thể
gồm nhiều mạng. Trong đó, lớp thứ nhất có duy
nhất một mạng, mạng này có nhiệm v
ụ phân
loại kí tự đầu vào về một trong các nhóm tương
ứng. Ứng với mỗi nhóm kí tự có nhiều hơn một
phần tử ở lớp thứ nhất là một mạng neuron ở
lớp mạng thứ hai. Tương tự như vậy, chúng ta
xác định được các mạng neuron ở lớp thứ ba,…
cho đến khi không còn nhóm kí tự nào có nhiều
hơn một phần tử. Như vậy một cách đệ
quy
chúng ta có thể xây dựng được hệ thống đa
mạng tương ứng với một phân nhóm kí tự cho
trước.
Hệ thống đa mạng làm việc theo quy trình
nhận dạng
sau: Ảnh của kí tự (đầu vào) được
đưa qua mạng neuron ở lớp đầu tiên. Mạng này
sẽ thực hiện việc phân loại (lan truyền xuôi tín

luyện song song các mạng đơn ứ
ng với từng
nhóm để mạng phân loại đúng các kí tự thuộc
nhóm này. Sau khi huấn luyện xong các mạng
(thu được bộ tham số phù hợp cho từng mạng),
ta cần ghép các mạng lại theo đúng cấu trúc của
phân nhóm kí tự để có hệ thống đa mạng cuối
cùng. Đây là hệ thống đã được huấn luyện.
Nhận xét: với phương pháp huấn luyện theo
lô, tuy thời gian tiến hành có lâu hơn như
ng
chúng ta không cần phải chọn ra những tập mẫu
học riêng cho từng mạng và cũng không phải
ghép các mạng lại sau khi huấn luyện. Hơn thế
nữa, khi có mẫu kí tự mới, việc học mẫu mới
này sẽ đơn giản hơn so với phương pháp huấn
luyện song song. Do đó, khi cài đặt hệ thống
thực nghiệm, em chọn phương pháp huấn luyện
theo lô.
5. Thực nghiệm
Do chưa có cơ sở dữ liệu kí tự viết tay tiếng
Việt chuẩn nào nên cùng với việc xây dựng hệ
thống thực nghiệm, chúng em đã tiến hành thu
thập cơ sở dữ liệu theo các tiêu chuẩn sau (đây
cũng chính là phạm vi của bài toán mà chúng
em đang giải quyết):
• Kiểu chữ “đứng” theo nghĩa không quá
nghiêng về bên trái hoặc phải.
• Chữ viết không thiếu hoặc thừa nét, dấu
được đặt chuẩn theo quy định của tiếng

hiện đề tài chung Nhận dạng đoạn văn bản viết
tay tiếng Việt nét liền).
Bên cạnh đó, chúng em đã cài đặt được hệ
thực nghiệm chung Nhận dạng đoạn văn bản
viết tay tiếng Việt nét liền và thu được những
kết quả ban đầu rất khả quan.
6. Kết luận
Sau quá trình nghiên cứu về mạng neuron và
bài toán nhận dạng chữ viết tay tiếng Việt, em
đã đề xuất một giải pháp khắc phục được những
khó khăn của bài toán và cài đặt được hệ thực
nghiệm nhận dạng chữ viết tay tiếng Việt bằng
mô hình đa mạng neuron với tỷ lệ nhận dạng
đúng khá cao (95.20%). Đây là một tỷ lệ cao so
với các hệ nhận dạ
ng chữ viết tay ở Việt Nam
hiện nay.
Tuy nhiên, vẫn còn những hạn chế đối với
hệ thống này đó là tiêu chuẩn thu thập cơ sở dữ
liệu huấn luyện còn khắt khe. Do đó, để hệ
thống có thể ứng dụng trong thực tế cần phải
nới lỏng hơn nữa các tiêu chuẩn này.
Trong thời gian tới em sẽ tiếp tục mở rộng
ph
ạm vi của bài toán và hướng tới phát triển
các ứng dụng thực tế như nhận dạng các bảng
kê khai tiếng Việt.
Tài liệu tham khảo
[1] Jain , Artificial Neural Networks A Tutorial,
IEEE 1996.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status