Tiểu luận môn cơ sở dữ liệu nâng cao CLUSTERING - Pdf 26

GVHD: PGS-TS Đỗ Phúc
SVTH: Phạm Quang Diệu
MSSV: CH1101077

Trong Hội nghị quốc tế lần thứ 14 về nhận dạng mẫu
(Pattern Recognition), Connell và Jain đã sử dụng
phương pháp gom nhóm (Clustering) để nhận dạng
những từ vị (lexemes) trên văn bản viết tay với mục
đích nhận dạng chữ viết độc lập với người viết.

Hệ thống phụ thuộc người viết
Hệ thống phụ thuộc người viết cho độ chính xác nhận
dạng cao hơn so với
hệ thống độc lập người viết
hệ thống độc lập người viết,
nhưng nó cũng đòi hỏi một lượng lớn dữ liệu training
(training data).

Mặt khác, một
hệ thống độc lập người viết
hệ thống độc lập người viết phải có
khả năng nhận dạng nhiều phong cách viết.

Do sự thay đổi gia tăng của phong cách viết phải được
ghi lại bởi hệ thống, thật sự càng khó hơn để phân biệt
giữa những lớp khác nhau bởi số lượng trùng lặp
trong không gian đặc trưng.

Một giải pháp đối với vấn đề này là chia dữ liệu thành
các lớp.



Sử dụng mô hình này, tốc độ nhận dạng chính xác đạt
được là 99,33%.

Chương trình:
Chương trình: Nhận dạng các ký tự số.
Địa chỉ download:
/>e/loadFile.do?objectId=18901&objectType=file

Tính năng bổ sung: Dùng Microsoft speech API để
đọc các chữ số.

Input:
Input: Bộ mẫu các chữ số từ 0 → 9 và ảnh có các chữ
số cần nhận dạng.

Output:
Output: Nhận dạng các chữ số xuất hiện trên ảnh và
đọc chúng.

Ứng dụng:
Ứng dụng: Nếu được nâng cấp thì chương trình này
có thể dùng để đọc sách điện tử cho người mù.

Mẫu các chữ số từ 0 → 9

Ảnh có các chữ số cần nhận dạng

Các số xuất hiện trong ảnh sẽ được đánh dấu bằng các
khung đỏ bao quanh và sau đó sẽ được đọc lên.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status