nhận dạng chữ viết và các hướng nghiên cứu - Pdf 13

1
ĐẠI HỌC DUY TÂN
KHOA CÔNG NGHỆ THÔNG TIN
Chủđề
NHẬN DẠNG CHỮ VÀ
CÁC HƯỚNG NGHIÊN CỨU
Ngườitrìnhbày
TS. PHẠM ANH PHƯƠNG
Bộ môn Cơ sở Tin học
Friday, March 04, 2011
2
NỘI DUNG TRÌNH BÀY
1. Giớithiệu
Friday, March 04, 2011
2. Sơđồtổng quát củamộthệ nhậndạng chữ
5. Các kiếnthứccầnthiết để nghiên cứu
4. Các hướng tiếpcậnnhậndạng
3. Các phương pháp trích chọn đặctrưng
6. Kếtluận
3
GIỚI THIỆU
Friday, March 04, 2011
Nhậndạng chữ là mộtlĩnh vực đã được quan tâm nghiên cứuvà
ứng dụng từ nhiềunămnay theohaihướng chính:
9 Nhậndạng chữ viếttay: vớinhững mức độ ràng buộc
khác nhau về cách viết, kiểuchữ phụcvụ cho các ứng dụng
đọcvàxử lý các chứng từ, hóa đơn, phiếughi, bảnviếttay
chương trình Nhậndạng chữ viếttayđược tách ra hai
hướng phát triển: nhậndạng chữ viếttaytrựctuyến(on-
line) và chữ viếttayngoạituyến(off-line).
9 Nhậndạng chữ in: phụcvụ cho công việctựđộng hóa đọc

LỊCH SỬ PHÁT TRIỂN
Friday, March 04, 2011
¾ Năm 1954, máy nhậndạng chữđầutiênđã đượcpháttriểnbởi
J. Rainbow dùng để đọcchữ in hoa nhưng rấtchậm.
¾ Mô hình nhậndạng chữ viết được đề xuấttừ năm 1951 do phát
minh của M. Sheppard đượcgọilàGISMO, mộtrobot đọc-viết.
Giai đoạn 1: (1900 – 1980) (tt)
¾ Năm 1967, Công ty IBM đãthương mạihóahệ thống nhận
dạng chữ.
7
LỊCH SỬ PHÁT TRIỂN
Friday, March 04, 2011
¾ Các hướng tiếpcậntheocấu trúc và đốisánhđượcápdụng
trong nhiềuhệ thống nhậndạng chữ.
¾ Vớisự phát triểncủacácthiếtbị phầncứng máy tính và các
thiếtbị thu thu nhậndữ liệu, các phương pháp luậnnhậndạng
đã đượcpháttriểntronggiaiđoạntrước đãcóđượcmôitrường
lý tưởng để triểnkhaicácứng dụng nhậndạng chữ.
Giai đoạn 2: (1980 – 1990)
¾ Trong giai đoạn này, các hướng nghiên cứuchỉ tậptrungvào
các kỹ thuậtnhậndạng hình dáng chứ chưaápdụng cho thông
tin ngữ nghĩa. Điềunàydẫn đếnsự hạnchế về hiệusuấtnhận
dạng, không hiệuquả trong nhiều ứng dụng thựctế.
8
LỊCH SỬ PHÁT TRIỂN
Friday, March 04, 2011
¾ Các kỹ thuậtnhậndạng kếthợpvớicácphương pháp luận
trong lĩnh vực học máy (Machine Learning) đượcápdụng
rấthiệuquả.
¾ Các hệ thống nhậndạng thờigianthực đượcchútrọng trong

•Lọc nhiễu •Tìmxương
•Hiệuchỉnh độ nghiêng
11
Giai đoạntáchchữ
Friday, March 04, 2011
•Táchdòng •Táchtừ, ký tự
12Friday, March 04, 2011
CÁC PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG
• Biến đổi toàn cục và khai triển chuỗi
• Đặc trưng thống kê
• Đặc trưng hình học và hình thái
13Friday, March 04, 2011
Biến đổi toàn cục và khai triển chuỗi
• Biến đổi Fourier
• Biến đổi Wavelet
• Khai triển Karhunent-Loeve
PCA - Principal Component Analysis
• Phương pháp mô men
14Friday, March 04, 2011
Đặctrưng thống kê
Phân vùng (Zone)
Các giao điểm và khoảng cách
15Friday, March 04, 2011
Đặctrưng thống kê (tt)
Chu tuyến (Contour Profile) Projection histograms
16Friday, March 04, 2011
Đặctrưng thống kê (tt)
Đặctrưng hướng (Direction Features)
Các ký tự được mô tả như các vectơ mà các
phần tử của nó là các giá trị thống kê về hướng.

tỏ ra kém hiệu quả.
Sử dụng trong giai đoạn hậu
xử lý để sửa các lỗi mà khối
nhận dạng đã thực hiện sai
Chữ viết đượcmôtả bởicácđồ
thị, mỗi đồ thị là sự kết hợp của
các dạng nguyên thuỷ: đoạn
thẳng, cung…
19
CÁC HƯỚNG TIẾP CẬN NHẬN DẠNG (tt)
Friday, March 04, 2011
• Tiếpcậnthống kê dựatrêncơ sở ba giả thuyết chính:
1. Phân bố củatập đặctrưng là phân bố Gauss hoặc
trong trường hợpxấunhấtlàphânbố đều.
2. Có các số liệuthống kê đầy đủ có thể dùng cho
mỗilớp.
3. Tập ảnh {I} có thể trích chọnmộttập đặctrưng
{f
i
}∈F, i∈{1, ,n} mà tập đặctrưng này đạidiện
cho mỗilớpmẫuriêngbiệt.
k-NN
k-NN
Bayes
Bayes
20
CÁC HƯỚNG TIẾP CẬN NHẬN DẠNG (tt)
Friday, March 04, 2011
• Các phương pháp học máy tiên tiến
Mô hình Markov ẩn

Friday, March 04, 2011
KiếntrúctuầntựKiếntrúctuầntự
Kiếntrúcsong songKiếntrúcsong song
Kiến trúc lai ghépKiến trúc lai ghép
Chuyểnkếtquảđầuracủamộtmáy
phân lớp thành đầuvàocủamáy
phân lớptiếp theo, các chiếnlược
tiêu biểu: Boosting, thác nước
Kếtnốikếtquả củacácmáy
phân lớp độclậpcủa nhiều
chiếnlược khác nhau. Tiêu biểu
nhấtlàchiếnlược bỏ phiếu và
luậtquyết định Bayes
Lai ghép giữahaikiếntrúctuầntự
và song song.
23
CÁC KIẾN THỨC CẦN THIẾT ĐỂ NGHIÊN CỨU
Friday, March 04, 2011
•Xử lý ảnh (Image Processing)
•Học máy (Machine Learning)
•Xác suất thống kê và toán ứng dụng
• Ngôn ngữ học và ngôn ngữ học tính toán
(Linguistic and Computational Linguistic)
Mạng nơ ron, HMM
SVM
Boosting,
Kernel method
Bayes
k-NN,
n-Gram


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status