Xây dựng hệ thống nhận dạng và dịch trên
thiết bị di động
Phạm Phi Hiệu
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Công nghệ Phần mềm; Mã số: 60 48 10
Người hướng dẫn: TS. Kiều Văn Hưng
Năm bảo vệ: 2011
Abstract: Trình bày kiến thức tổng quan về lĩnh vực OCR (Optical Character
Recognition) - Lĩnh vực nhận dạng ký tự quang học. Tìm hiểu nội dung về công nghệ
mã nguồn mở Tesseract OCR, công nghệ Android, mô hình client/server, công nghệ
dịch Google Translate. Các công nghệ, mô hình này được sử dụng để xây dựng hệ
thống. Giới thiệu kiến trúc và các thành phần cơ bản của hệ thống nhận dạng và dịch
trên thiết bị di động đã xây dựng. Trình bày kết quả thực nghiệm chức năng rút trích
thông tin từ ảnh của hệ thống cũng như so sánh một sách tương đối kết quả OCR với
một số hệ thống khác.
Keywords: Công nghệ mã nguồn mở; Dịch; Hệ thống nhận dạng; Ký tự quang học;
Thiết bị di động
Content
MỞ ĐẦU
Đặt vấn đề
Từ lâu con người đã quen với việc sử dụng máy tính để lưu trữ những tài liệu cần
thiết, xuất phát từ những tiện ích to lớn do máy tính mang lại: lưu trữ khối dữ liệu lớn, ít bị hư
hỏng, dễ quản lí, dễ tìm kiếm, dễ chỉnh sửa Tuy nhiên giấy vẫn là một vật liệu quan trọng
đã, đang và sẽ được sử dụng để lưu trữ tài liệu vì sự cần thiết của nó trong cuộc sống hàng
quan với chiếc máy tính bên cạnh. Tuy nhiên nhu cầu OCR của chúng ta có thể xuất hiện mọi
lúc mọi nơi, ví dụ muốn lưu nhanh thông tin trong một name card mà người bạn đưa cho vào
điện thoại mà không phải nhập bằng tay. Song chúng ta không thể lúc nào cũng mang bên
mình máy scan, máy ảnh cũng như máy tính để hỗ trợ cho việc OCR. Chưa kể đôi khi chúng
ta muốn dịch nhanh một bảng chỉ dẫn bằng tiếng nước ngoài mà không có từ điển bên cạnh.
Một khó khăn nữa là các ứng dụng OCR hiệu quả cho công việc của chúng ta lại đa phần
được tung ra dưới dạng thương mại, muốn sử dụng phải mất một chi phí không nhỏ. Chính
những sự bất tiện thực tế trên, vấn đề đặt ra là phải có những hệ thống phần cứng-phần mềm
nhỏ gọn, di động nhưng vẫn thực hiện một cách linh hoạt và hiệu quả các chức năng chụp ảnh
tài liệu, OCR trên ảnh đã chụp và dịch kết quả ra ngôn ngữ khác.
Hiện nay công nghệ mạng internet phát triển mạnh mẽ, internet có mặt hầu hết khắp
nơi trên thế giới. Công nghệ di động phát triển vượt bậc, việc sử dụng điện thoại bùng nổ,
điện thoại di động trở thành mặt hàng bình dân mà ai cũng có thể sở hữu được. Nhiều công
nghệ OCR tiên tiến được đưa ra dưới dạng mã nguồn mở và được các công ty, tổ chức lớn tài
trợ phát triển. Với nền tảng công nghệ hiện có ở trên đã tạo ra nhiều giải pháp để xây dựng
được nhiều hệ thống có khả năng đáp ứng cao với vấn đề đặt ra.
Mục tiêu nghiên cứu
Với mong muốn tìm hiểu về lĩnh vực và một số công nghệ OCR tiên tiến, đồng thời
mong muốn góp phần vào kho ứng dụng OCR hiện có một sản phẩm nguồn mở mới: một hệ
thống trên thiết bị di động giúp con người có thể thu ảnh, rút trích thông tin trong ảnh, dịch
kết quả ra ngôn ngữ mong muốn và quản lý các thông tin ấy trên thiết bị di động. Thiết bị di
3
động được chọn là điện thoại di động chạy hệ điều hành nguồn mở Android. Và từ đó luận
văn lựa chọn đề tài nghiên cứu “Xây dựng hệ thống nhận dạng và dịch trên thiết bị di động”.
Nội dung nghiên cứu
Chương 2: Trình bày nội dung tìm hiểu về công nghệ mã nguồn mở Tesseract OCR,
công nghệ Android, mô hình client/server, công nghệ dịch Google Translate. Các công nghệ,
mô hình này được sử dụng để xây dựng hệ thống.
Chương 3: Giới thiệu kiến trúc và các thành phần cơ bản của hệ thống nhận dạng và
dịch trên thiết bị di động đã xây dựng. 4
Chương 4: Trình bày kết quả thực nghiệm chức năng rút trích thông tin từ ảnh của hệ
thống cũng như so sánh một sách tương đối kết quả OCR với một số hệ thống khác.
References
Tiếng Việt
[1] Đinh Điền (2005), Xử lý ngôn ngữ tự nhiên, Giáo trình, NXB ĐHQG TPHCM.
[2] Nguyễn Quang Hoan (2006), Xử lý
ảnh, Giáo trình, Học viện Công nghệ Bưu chính Viễn
thông .
[3] Nguyễn Văn Huy (2009), Tìm hiểu phương pháp phân tích trang tài liệu, Luận văn Thạc
sĩ, Đại học Thái Nguyên.
[4] Đỗ Năng Toàn, Phạm Việt Bình (2007), Xử lý
ảnh, Giáo trình, Đại học Thái Nguyên.
Tiếng Anh
[5] Huang Xuguang, “An Introduction to Android”, Database Lab, Inha University,
November 2009.
[6] Hui-Fuang Ng*, “Automatic thresholding for defect detection”, February 2006.
[7] K. M. Mohiuddlin, Jianchang Mao, “Optical Character Recognition”, 27 Dec 1999.
[18]
[19]
[20]
[21]
[22] .