041_Thực nghiệm và đánh giá một phương pháp nhận dạng chữ tiếng Việt in - Pdf 63

- 68 -
THỰC NGHIỆM VÀ ĐÁNH GIÁ MỘT PHƯƠNG PHÁP
NHẬN DẠNG CHỮ TIẾNG VIỆT IN

Trần Hà Tuyên Người hướng dẫn: TS. Nguyễn Trọng Dũng
MSSV: 0122147
Email: [email protected]

1.Giới thiệu
Nhận dạng chữ (chữ in , chữ viết tay) là một
trong những hệ thống nhận dạng nhằm mục đích
tự động hoá quá trình thu nhận các thông tin
dạng chữ. Trong các hệ thống này , từ một dạng
thông tin thu nhận được(các ảnh chữ qua máy
scan...) hệ thống sẽ phân tích , sắp xếp, gạn lọc,
phân loại chúng và dùng các kỹ thuật riêng biệt
để xử lý chúng nhằm đưa ra ý nghĩa các thông
tin đó mang tính ứng dụng phục vụ đời sống con
người.
Lĩnh vực nhận dạng chữ in đã và đang thu
hút được sự quan tâm của nhiều nhà nghiên cứu
khoa học trong các lĩnh vực từ tin học đến toán
học.... bởi tầm quan trọng của nó . Nhận dạng
chữ in đã và đang có mặt trong nhiều ứng dụng
như là lưu trữ văn bản , phân loại thư tín, lưu trữ
hồ sơ học sinh, thanh toán tiền trong nhà băng,
hệ thống thống kê tự động các phiếu điều tra....
Tuy nhiên kết quả của việc nhận dạng nói chung
và việc nhận dạng chữ Tiếng Việt nói riêng
chưa đáp ứng được nhu cầu thực tế. Vì thế với
mong muốn cải tiến nâng cao chất lượng nhận

Tư tưởng của thuật toán là so sánh chữ cần
nhận dạng với một tập mẫu các chữ cái trong cơ
sở dữ liệu để xét xem chữ cần nhận dạng giống
mẫu chữ nào nhất. Vấn đề là phải đưa ra được
đại lượng để đo được độ giống nhau giữa chữ
cần nhận dạng với mẫu.Vì thể ta xét toàn bộ giá
trị
các điểm ảnh của ảnh chữ và mẫu nhận dạng
và so sánh từng cặp giá trị ở cùng vị trí với
nhau. Ta xét :

m
δ
(
i,j
)=



=∧=
lai nguoc 0
)()(neu1 jyix
mmTrong đó y
m
và x
m
là giá trị điểm ảnh thứ m

, n
00.
Từ đó ta đưa ra đại lượng để đo
độ giống nhau giữa chữ nhận dang Y và mẫu X
như sau:
T(Y,X)
= n
11
/(

n
11
+

n
01
+ n
10
)
Đại lương trên được xây dựng trên cơ sở
lấy các điểm đen(điểm ảnh có giá trị 1) làm
chính là bởi điểm đen thường có ý nghĩa nhận
dạng cao hơn điểm trắng rất nhiều. Khi so sánh
chữ cần nhận dạng với mẫu chữ thì đại lượng
này phải vượt qua một ngưỡng nhất định thì mới
được gán cho mẫu đó, thông thườ
ng giá trị này
là 0,5
4. Đánh giá các ưu, nhược điểm của thuật
toán và các biện pháp khắc phục

,
a ...

Ở lần thực nghiệm thứ 1 do chữ nhận dạng
và tập mẫu có cùng kiểu nên cho kết quả khá
chính xác. Ở lần thực nghiệm thứ 3 chương
trình sử dụng một tập mẫu riêng cho mỗi chữ
cái đã cho kết quả chính xác khắc phục được
nhược điểm của lần thực nghiệm 2 khi font chữ
nhận dạng và mẫu khác kiểu nhau.
6. Kết luận
Trong bài khoá luận tốt nghiệp này em đã
xây dựng được một phương pháp nhận dạng dựa
trên mô hình Template Matching. Sau một quá
trình nghiên cứu, Luận văn đã đạt được một số
kết quả như sau:
+ Phân tích so sánh các ưu điểm, nhược điểm
của phương pháp nhận dạng chữ.
+ Xây dựng thuật toán nhận dạng chữ và đưa
vào hoạt động có hiệu quả
+ Cải ti
ến thuật toán và đạt được kết quả
chính xác như mong đợi.
Tuy nhiên do số lượng mẫu nhận dạng còn
hạn chế nên việc đánh giá thuật toán cũng như
khắc phục các vấn đề khác nảy sinh còn hạn chế
Các vấn đề tiếp tục nghiên cứu là xây dựng
mối liên hệ giữa các tập mẫu trong cơ sở dữ liệu
để có thể giảm thiểu số lượ
ng mẫu chữ cần đưa


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status