- 44 -
NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG NHẬP TÀI LIỆU TỰ
ĐỘNG BẰNG NHẬN DẠNG QUANG HỌC
Đinh Văn Phương
MSSV: 0220250
Email: [email protected]án bộ hướng dẫn: ThS. Đào Kiến Quốc.
1. Giới thiệu
Nhập dữ liệu tự động đang là bài toán ngày
càng thu hút nhiều sự chú ý vì khả năng áp dụng
rộng rãi vào thực tế cũng như những hiệu quả mà
nó mang lại. Trong hệ thống này, khử nhiễu, khử
nghiêng và phân vùng ảnh là một phần có vai trò
đặc biệt quan trọng. Chức năng của nó là chính
xác ảnh và tách ra các vùng được nhập thông tin
để làm đầu vào cho module nhận dạng chữ. Dựa
trên đặc tính của ảnh tài liệu được scan, chúng tôi
đã sử dụng phương pháp điều chỉnh mức xám để
tách nền ra khỏi phần thông tin cần nhận dạng; và
sử dụng phương pháp phép chiếu để khử nghiêng
ảnh do phương pháp này đạt được độ chính xác
cao đối với những ảnh có đặc trưng trên. Cũng
dựa trên đặc điểm của kiểu form văn bản là dữ
liệu được nhập vào các ô trên form (nghĩa là nằm
trong giới hạn giữa các đường thẳng), giải pháp
đó cũng có một số phương pháp xác định góc
nghiêng cho ảnh của văn bản như: các phương
pháp dựa trên biến đổi Hough, các phương pháp
dựa trên Nearest Neighbour, các phương pháp
dựa trên registered object… Do đặc điểm của ảnh
tài liệu nên chúng tôi lựa chọn phương pháp phép
chiếu cải tiến [2] cho bài toán nhập tài liệu tự
động.
3. Tiền xử lý ảnh áp dụng cho bài toán nhập tài
liệu tự động
a. Lọc nhiễu, tách nền.
Ảnh của văn bản gốc vốn dĩ là ảnh nhị phân,
tức là chỉ có hai ngưỡng đen, trắng cho chữ và
nền. Song sau khi in ra và quét lại vào máy tính,
nó trở thành ảnh đa mức xám tức là có 256
ngưỡng khác nhau. Một số vùng nền có thể xám
hơn, ngược lại một số đối tượng chữ, bảng và
dòng kẻ
có thể mờ đi. Nhiệm vụ của chúng ta ở
đây là tách các đối tượng cần xử lý ra khỏi hình
nền.
Thuật toán được xây dựng dựa trên giả thiết
mặc dù có sự biến đổi về ngưỡng tuy nhiên vẫn
có sự khác biệt giữa ngưỡng của chữ và của nền.
Thông qua việc tăng cường độ tương phản lặp lại
nhiều lần, ta hi vọng rằng có thể khuyếch đại sự
khác biệt này một cách đáng kể. Tuy nhiên với
cách lọc trực tiếp trên ảnh này thì không hiệu quả
- 45 -
a. Thực nghiệm về lọc nhiễu, tách nền
Chúng tôi thực nghiệm với 60 ảnh khác
nhau, và thu được kết quả:
DPI Hiệu năng
(ms)
Số lần lọc
Trung bình
100
7.63 3.43
150
15.53 3.57
200
36.81 3.21
300
95.21 3.34
Từ kết quả thực nghiệm trên ta thấy rõ
việc lọc ảnh trên Histogram tỏ ra rất hiệu quả, tốc
độ thực thi không phụ thuộc vào số lần lặp mà
chúng chỉ phụ thuộc vào độ phân giải.
b. Thực nghiệm về xác định góc nghiêng của
ảnh
Thực nghiệm về xác định góc nghiêng của
ảnh được cài đặt theo phương pháp phép chiếu
trên 60 ảnh, với 300 góc nghiêng khác nhau cho
mỗi một ảnh, tổng số ảnh thử nghiệm là 18000
ảnh.
độ lệch trung bình so với góc thực tế với sai số ±0.1
0
• Nâng cao hiệu năng và độ chính xác
cho module tiền xử lý ảnh và phân
vùng.
Tài liệu tham khảo
[1] Ergina Kavallieratou, “A Binarization
Algorithm specialized on Document
Images and Photos”.
[2] Fu Chang, Chien-Hsing Chou, and Shih-
Yu Chu. A New Approach to Estimation
of Document Skew Angles Based on
Piecewise Linear Approximation of Line
Objects. 2004.
[3] Myler H.R., Weeks A.R. Computer
imaging recipes in C, ©1993.