I. Mở đầu:
1. Lý do chọn đề tài
Công nghệ thông tin đang là một trong những ngành then chốt trong quá
trình công nghiệp hóa hiện đại hóa đất nước. Việc triển khai nghiên cứu các
công trình khoa học và đưa vào thực tế ứng dụng góp phần giải phóng sức lao
động con người, tiết kiệm thời gian, nâng cao hiệu suất công việc là một việc
làm hết sức có ý nghĩa trong giai đoạn này.
Bài toán nhận dạng chữ viết tay xuất hiện cách đây khá lâu và vẫn luôn thu
hút được nhiều sự quan tâm, nghiên cứu của các nhà khoa học. Đã xuất hiện
nhiều ứng dụng thương mại thực hiện nhận dạng chữ tùy theo từng yêu cầu cụ
thể, có thể kể ra một số sản phẩm tiêu biểu như: OmniPage, FineReader Ở
Việt Nam, việc nghiên cứu xây dựng các hệ nhận dạng chữ tiếng Việt cũng
được bắt đầu rất sớm. Hiện tại trong lĩnh vực nhận dạng chữ in đã có một số
sản phẩm thương mại với chất lượng tốt như VnDOCR của Viện Công Nghệ
Thông Tin, ImageScan của CadPro. Ngoài ra còn có một số đề tài nghiên cứu
khoa học về nhận dạng số và chữ viết tay được thực hiện bởi nhiều nhóm tác
giả, với nhiều mục đích ứng dụng khác nhau mà ta có thể kể tên một số nhóm
tiêu biểu như nhóm nghiên cứu : Huỳnh Hữu Lộc, Lưu Quốc Hải, Nguyễn
Thanh Bình và Đinh Đức Anh Vũ, Khoa Khoa Học và Kỹ Thuật Máy Tính,
Đại học Bách Khoa Tp.HCM, nhóm nghiên cứu : Phạm Anh Phương, Ngô
Quốc Tạo, Lương Chi Mai với đề tài : “Trích chọn đặc trưng wavelet Haar kết
hợp với SVM cho việc nhận dạng chữ viết tay Tiếng Việt”, hoặc đề tài “Nhận
dạng phiếu trả lời trắc nghiệm và có nhận dạng chữ số viết tay dựa trên mạng
Noron “ của nhóm tác giả : Trầm Quốc Thuận, Châu Kiến tài, trường Đại học
Mở TpHCM…
Ngày nay, nền giáo dục đào tạo ở nước ta ngày càng phát triển, lượng học
sinh- sinh viên ở các trường ngày càng gia tăng, và danh sách thí sinh dự thi
trong các kì thi cũng tăng lên theo đó. Do vậy, điểm sau mỗi đợt thi nếu được
nhập bằng thủ công vào cơ sở dữ liệu thì sẽ không đảm bảo được tính chính
xác, mất rất nhiều nhân công, thời gian. Hiện nay, có một số trường đã nghiên
cứu, triển khai hệ thống nhận dạng điểm số một cách tự động trên bảng điểm
Đề xuất áp dụng mạng Nơron nhân tạo thực hiện các thuật toán xử lý ảnh
và nhận dạng số và chữ số viết tay Tiếng Việt.
Cải tiến và đề xuất ra các thuật toán mới trong quá trình nghiên cứu.
Xây dựng được hệ thống nhận dạng số và chữ số viết tay Tiếng Việt trên
bảng điểm thi dựa vào mạng Neuron nhân tạo. Hệ thống được thiết kế để hỗ
trợ việc nhận dạng số và chữ số viết tay trên bảng điểm thi qua mạng cũng như
quản lý dữ liệu sinh viên.
3. Đối tượng và phạm vi nghiên cứu
Luận văn tập trung nghiên cứu và ứng dụng mạng Noron nhân tạo để xây
dựng một ứng dụng nhận dạng số và chữ viết tay theo đúng qui định bảng
điểm thi mẫu. Các qui định về bảng điểm thi mẫu bao gồm: chữ viết tay phải
rõ ràng, ảnh bảng điểm thi được scan phải ngay ngắn, đảm bảo độ sáng của
ảnh… Việc nhận dạng chữ viết tay ở đây tiến hành cụ thể tương ứng với các số
từ 0 đến 10 được viết tay, trong đó có nhận dạng các số lẽ như :1.5, 2.5, 3.5…
và các chữ số tương ứng như : một, một năm, hai, hai năm….
4. Phương pháp nghiên cứu
Để đạt được mục tiêu đề ra, chúng tôi quan tâm đến việc nghiên cứu lý
thuyết điểm ảnh, các thuật toán rút trích, xử lý điểm ảnh, mạng Neuron và các
phương pháp nhận dạng chữ viết hiện nay. Đồng thời đề xuất một số giải pháp
cải tiến phương pháp đang sử dụng.
3
3
Hình 2 : Bảng điểm thi mẫu4
4
4.1. Cơ sở dữ liệu:
- Cơ sở dữ liệu bao gồm các mẫu từ và số được lấy từ bộ mẫu có sẵn
Bước này được thực hiện duy nhất cho lần đầu chạy chương trình để
ta tìm ra tọa độ dòng và cột ở những nơi cần nhận dạng của bảng điểm mẫu.
Việc xác định tọa độ dựa trên các điểm nhận dạng gốc của bảng điểm.
Hình 4 : Tọa độ vị trí các điểm cần nhận dạng theo hàng
6
6
Hình 5 : Tọa độ vị trí các điểm nhận dạng theo cột
7
7
Hình 6 : Xác định tọa độ nhận dạng
4.2.4 Phân tích ảnh để tìm từ
Ảnh sau khi đã xác định tọa độ các vùng cần nhận dạng, ta tiến hành quá
trình phân tích ảnh để tìm từ bao gồm các bước sau:
8
8
- Xác định vùng chuỗi từ và số cần nhận dạng .
- Tách chuỗi từ, chuỗi số ra khỏi ảnh.
- Tách các từ, các số ra khỏi chuỗi từ, chuỗi số.
Dựa vào các điểm tọa độ nhận dạng kết hợp với giải thuật dò tìm các biên
của vùng ảnh để tiến hành xác định vùng ảnh cần được xử lý cho bước tiếp
theo.
Hình 7: Xác định loại bỏ đường biên của ảnh nhận dạng
Hình 8: Tách từ ra khỏi chuỗi từ
Thuật toán sử dụng để tách từ ra khỏi văn bản dựa trên lược đồ chiếu dọc
(Vertical projection Histogram) kết hợp đặc tính biên độ về độ sáng của các
pixel.
4.2.5 Mạng Neuron-mờ nhận dạng từ
Lớp ẩn
thi,qua đó thực hiện việc thực hiện nhận dạng chữ viết tay tiếng Việt với
những cải tiến mới hiệu quả hơn. Dự kiến luận văn sẽ bao gồm các chương
sau:
Chương 1: TỔNG QUAN
Dự kiến sẽ trình bày một số nội dung sau:
Dẫn nhập, giới thiệu lý do chọn đề tài.
Mục đích và phương pháp nghiên cứu của đề tài.
Những đóng góp của đề tài.
Bố cục luận văn.
Chương 2: CƠ SỞ LÝ THUYẾT
Dự kiến sẽ trình bày một số nội dung sau:
Giới thiệu tổng quan về điểm ảnh.
Giới thiệu mạng Neuron nhân tạo.
Giới thiệu tình hình nghiên cứu trong và ngoài nước.
Trình bày chi tiết các thuật toán, giải thuật của quá trình nhận
10
10
diện số và chữ số viết tay Tiếng Việt trên bảng điểm thi.
Chương 3: THỰC NGHIỆM
Dự kiến sẽ trình bày một số nội dung sau:
Giới thiệu về ứng dụng, phần mềm và phần cứng trong quá
trình thực nghiệm.
Kết quả của các bước tiến hành thực nghiệm.
Xây dựng được ứng dụng nhận dạng số và chữ viết tay Tiếng
Việt cho bảng điểm thi.
So sánh với kết quả của các nghiên cứu trước đó.
Kết luận rút ra từ kết quả thực nghiệm .
Chương 4: KẾT LUẬN
Dự kiến sẽ trình bày một số nội dung sau:
Kết quả đạt được của luận văn.
[10]. Lê Xuân Trường, Trầm Quốc Thuận, Châu Kiến tài. Nhận dạng phiếu trả
lời trắc nghiệm và có nhận dạng chữ số viết tay dựa trên mạng Noron
[11]. William K.Pratt, “Digital Image Processing”, John Wiley & Sons 2001.
[12]. CHRISTOPHER M. BISHOP(1995), Neural Networks for Pattern
Recognition.pdf, CLARENDON PRESS • OXFORD, UK.
[13]. Robert Full´er. The Perception Learning Rule – Tutorial. Institute for
Advanced Management Systems Research Department of Information
Technologies, 4-2010.
[14]. N. K. Kasabov, J. S. Kim, A. R. Gray, M. J. Watts. FuNN - A Fuzzy
Neural Network Architecture for Adaptive Learning and Knowledge
Acquisition. Department of Information Science University of Otago, P.O.Box
56, Dunedin, New Zealand Abo Akademi University.
[15]. Arnold F. Shapiro. The Merging of Neural Network, Fuzzy logic, and
Genetic Algorithm. SoA 2002 Spring Meeting.
[16]. Chin-Teng Lin, Chang-Mao Yeh, Jen-Feng Chung, Sheng-Fu Liang and
Her-Chang Pu. Support-Vector-Based Fuzzy Neural Networks.
[17]. Puyin Liu, Hongxing Li. Fuzzy Neural Network theory and application.
Series in Machine Perception and Artificial Intelligence – Vol.59. World
Scientific Publishing Co. Pte. Ltd, 2004.
V. Dự kiến kế hoạch thực hiện:
STT Nội dung Thời gian thực hiện
1 Nghiên cứu lý thuy ết 7/10/2011 - 15/1/2011
2 Thực hiện đề tài 19/1/2012 -20/04/2012
3 Viết báo cáo – hiệu chỉnh 21/04/2012 - 30/05/2012
12
12
Ý KIẾN CỦA GIÁO VIÊN HƯỚNG DẪN NGƯỜI LẬP ĐỀ CƯƠNG
(Ký ghi rõ họ tên) (Ký ghi rõ họ tên)
TS. Lê Xuân Trường Nguyễn Phú Lợi
XÁC NHẬN CỦA TRƯỞNG TIỂU BAN CHẤM ĐỀ CƯƠNG