Tóm tắt Đồ án tốt nghiệp Nhận dạng biển chỉ dẫn dịch sang tiếng Việt bằng PCA - Pdf 39

TÓM TẮT ĐỒ ÁN TỐT NGHIỆP
1. Tên đề tài
Nhận dạng biển chỉ dẫn dịch sang tiếng việt bằng PCA.
2. Mô tả bải toán
Ứng dụng nhận dạng biển chỉ dẫn cũng nhƣ tất cả các loại biển phục vụ trong
đời sống của con ngƣời là đề tài thu hút nhiều sự quan tâm nghiên cứu và phát triển.
Ứng dụng này không chỉ dừng ở nhận dạng ra các ký tự mà còn dịch từ tiếng anh ra
tiếng việt. Góp phần xây dựng nên từ điển Anh Việt, nghĩa là nó dịch nghĩa từ hình
ảnh.
3. Đóng góp của tác giả
Xây dựng phƣơng pháp trích thông tin trên biển chỉ dẫn (cụ thể là từ ngữ trên
đó).
Xây dựng phƣơng pháp áp dụng PCA cho ký tự và nêu ra đƣợc ƣu nhƣợc
điểm của phƣơng pháp PCA cho việc nhận dạng ký tự
Xây dựng bộ từ điển Anh – Việt về chủ đề biển chỉ dẫn.
4. chức năng chính

i


Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa.

ii


MỤC LỤC
LỜI CẢM ƠN ............................................................... Error! Bookmark not defined.
LỜI CAM ĐOAN .......................................................... Error! Bookmark not defined.
NHẬN XÉT CỦA GIÁO VIÊN HƢỚNG DẪN .......... Error! Bookmark not defined.
PHIẾU DUYỆT ĐỒ ÁN TỐT NGHIỆP ....................... Error! Bookmark not defined.
TÓM TẮT ĐỒ ÁN TỐT NGHIỆP ..................................................................................i


1.4

phƣơng pháp giải quyêt bài toán đặt ra ..........................................................3

1.4.1

Một số hƣớng giải quyết bài toán nhận dạng biển chỉ dẫn .................... 4

1.4.2

Một số hƣớng giải quyết nhận dạng ký tự ............................................. 5

1.4.3

Một số hƣớng giải quyết dịch sang tiếng việt ........................................ 5

1.5

Hƣớng giải quyết của đề tài ............................................................................6

1.5.1

Đặc điểm của bảng chỉ dẫn .................................................................... 6

1.5.2

Các bƣớc thực hiện................................................................................. 6

1.6


2.2.3 Giới thiệu một số ứng dụng của xử lý ảnh .......... Error! Bookmark not
defined.
iii


2.3
2.3.1

Thƣ Viện Xử Lý Ảnh OPENCV .................. Error! Bookmark not defined.
Vài nét về Computer Vision ................. Error! Bookmark not defined.

2.3.2 Thƣ viện mã nguồn mở OpenCV của Intel ......... Error! Bookmark not
defined.
2.4

Hệ Quản Trị Cơ Sở Dữ Liệu MYSQL ......... Error! Bookmark not defined.

2.4.1

Khái niệm: ............................................ Error! Bookmark not defined.

2.4.2

Tại sao dùng MYSQL .......................... Error! Bookmark not defined.

2.5

khái niệm Toán học trong pca (phân tích thành phần chính)Error! Bookmark not defin


Dữ liệu đầu vào ............................................. Error! Bookmark not defined.

3.3

Quá trình xử lý để nhận dạng dịch nghĩa...... Error! Bookmark not defined.

3.3.1

Tổng quan quá trình thực hiện ............. Error! Bookmark not defined.

3.3.2

Tải ảnh .................................................. Error! Bookmark not defined.

3.3.3

Tách vùng từ có trên trên biển ............. Error! Bookmark not defined.

3.3.4

Chƣơng trình tách ký tự ....................... Error! Bookmark not defined.

3.3.5

Nhận dạng ký tự bằng PCA ................. Error! Bookmark not defined.

3.3.6

Dịch sang tiếng việt .............................. Error! Bookmark not defined.


Hạn chế ................................................................................................... 9

4.2

Hƣớng phát triển ...........................................................................................10

DANH MỤC TÀI LIỆU THAM KHẢO ...................... Error! Bookmark not defined.
iv


v


DANH MỤC CÁC HÌNH VẼ
Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa. ----------------------------------- ii
Hình 2. Biển chỉ dẫn đƣờng. ---------------------------------------------------------------- 2
Hình 3. Biển chỉ dẫn cổng vào tòa nhà. --------------------------------------------------- 3
Hình 4. Biển chỉ dẫn phòng. ---------------------------------------------------------------- 3
Hình 5. Mô hình giải quyết bài toán. ----------------- Error! Bookmark not defined.
Hình 6. Ví dụ về Computer Vision. ------------------ Error! Bookmark not defined.
Hình 7. Tổ chức thƣ viện OpenCV.------------------- Error! Bookmark not defined.
Hình 8. Tổng quan quá trình thực hiện. -------------- Error! Bookmark not defined.
Hình 9. Quá trình mở ảnh. ----------------------------- Error! Bookmark not defined.
Hình 10. Quá trình tách từ. ----------------------------- Error! Bookmark not defined.
Hình 11. Biển chỉ dẫn đƣợc khoanh vùng chọn. ---- Error! Bookmark not defined.
Hình 12. Sơ đồ tách ký tự. ----------------------------- Error! Bookmark not defined.
Hình 13. ảnh đầu vào để tách hình chứa ký tự. ----- Error! Bookmark not defined.
Hình 14. Kết quả nhị phân ảnh.----------------------- Error! Bookmark not defined.
Hình 15. Kết quả khoanh vùng đối tƣợng. ----------- Error! Bookmark not defined.
Hình 16. Kết quả tách từ. ------------------------------- Error! Bookmark not defined.

một quá trình nghiên cứu với mục đích mang lại cho ngƣời dùng nhanh chóng dịch
đƣợc nghĩa của từ (cụ thể là từ tiếng anh) nằm trên bất ký biển chỉ dẫn nào.

1.2 MỤC ĐÍCH VÀ Ý NGHĨA
1.2.1 Mục đích:
Với đề tài “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt” em xác định cho
mình các mục đích cần đạt đƣợc cho quá trình thực hiện luận văn nhƣ sau:


Hiểu thêm đƣợc môn xử lý ảnh.



Biết đƣợc cách xây dựng thuật toán (cụ thể là thuật toán PCA xây
dựng trong bài)



Tìm hiểu xây dựng ứng dụng winForm bằng ngôn ngữ C++.



Biết áp dụng thƣ viện OPENCV cho xử lý ảnh.



Nắm bắt chu trình để xây dựng và phát triển cho sản phẩm phần mềm.





Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Hình 3. Biển chỉ dẫn cổng vào tòa nhà.

Hình 4. Biển chỉ dẫn phòng.

1.3.2 Ứng dụng
Hiện nay có rất nhiều biển chỉ dẫn thuộc nhiều lĩnh vực khác nhau trong đời
sống. Mục đích chính của nó là để hƣớng dẫn con ngƣời hiểu và bắt kịp những gì
cần thiết ngay tại thời điểm mong muốn đƣợc hƣớng dẫn về một cái gì đó.
Chính vì nhu cầu trên em xây dựng phần mềm “Nhận dạng biển chỉ dẫn và
dịch sang tiếng việt”. Với Tiêu chí là góp một phần nào đó vào việc làm cho ngƣời
hiểu đƣợc về bảng chỉ dẫn mà chƣa biết ngoại ngữ (cụ thể đó là biển chỉ dẫn về
tiếng anh).

1.4 PHƢƠNG PHÁP GIẢI QUYÊT BÀI TOÁN ĐẶT RA
Nhằm đạt đƣợc kết quả trông đợi nhƣ đã đề ra, và hoàn thành luận văn đúng
thời hạn, em đã chuẩn bị kế hoạch thực hiện các công việc chi tiết nhƣ sau:
 Liệt kê những yêu cầu lớn trong đề bài.
 Đề ra phƣơng pháp giải quyết với mỗi yêu cầu trên.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

 Chọn ra phƣơng pháp giải quyết phù hợp với đề tài cho mỗi yêu cầu

kiện.
Ƣu điểm: Không lệ thuộc vào ảnh đầu vào.
Nhƣợc điểm: Chi phí tính toán cao nếu không giải quyết tốt giai đoạn tìm
cạnh , và đòi hỏi những heuristic đƣa vào phải qua thƣc nghiệm kiểm chứng hoặc
do các chuyên gia cung cấp.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

1.4.1.4 Hướng tiếp cận thủ công
Ý tƣởng chính của phƣơng pháp: Áp dụng thao tác của ngƣời dùng, vẽ
khung trên ảnh, với điều kiện khung đó nằm trên biển chỉ dẫn.
Ƣu điểm: Nhanh, gọn, thích hợp cho ứng dụng này khi ngƣời dùng cần dịch
những chổ không hiểu, tránh nhập nhằng trong việc nhận dạng bảng chỉ dẫn, chi phí
tính toán không cao.
Nhƣợc điểm: Ngƣời dùng vẽ không chính xác vùng biển hoặc biển có độ
nghiêng và độ lệch cao.

1.4.2 Một số hƣớng giải quyết nhận dạng ký tự
Với tên đề tài là “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt bằng PCA”
thì cũng đã biết đề tài hƣớng nhận dạng chính của bài luận là dùng giải thuật PCA
(phân tích thành phần chính).
Thuật toán PCA cùng với nhận dạng bằng phƣơng pháp nơron, máy học SVN
đƣợc dùng nhiều trong kỹ thuật nhận dạng.
Kỹ thuật PCA đƣợc nhắc nhiều nhất trong nhận dạng khuôn mặt. Với đề tài
này sẽ tìm hiểu sâu hơn kỹ thuật PCA trong vấn đề nhận dạng ký tự. Cũng nhƣ đƣa
ra đƣợc ƣu và nhƣợc điểm của kỹ thuật PCA trong việc nhận dạng ký tự.


thƣớc các biển không đồng nhất, không cùng loại. Và cả nền và màu nền và màu
sắc của các ký tự trên bảng cũng khác nhau.
Với đặc điểm đó ta áp dụng tiếp cận 3 phƣớng pháp tiếp cần vùng, dò biên
Hough và phát hiên biên – Heuristic là khó khăn
Còn phƣơng pháp cuối là phƣơng pháp bằng phƣơng pháp thủ công, Cũng
may là phƣơng pháp này cũng thuận lợi cho việc ngƣời dùng chỉ trích những chổ họ
muốn trích từ bảng chỉ dẫn rồi dịch sang đoạn tiếng việt. Phƣơng pháp này rất tối
ƣu khi xây dựng trên nền tảng di động. Do bƣớc đầu thực hiện đề tài liên quan đến
xử lý và nhận dạng nên chọn làm trên windown application để dễ thực hiện và điều
tra độ phức tạp trƣớc khi làm trên ứng dụng di động.

1.5.2 Các bƣớc thực hiện
Để nhận dạng bảng chỉ dẫn và dịch sang tiếng việc thì trong báo cáo ta trình
bày các bƣớc hƣớng đề tài thực hiện các bƣớc theo thứ tự sau:
Bƣớc 1: Ảnh truyền vào máy tính, gọi ảnh đầu vào là F(x,y).
Bƣớc 2: Từ ảnh đầu vào ta sử dụng phƣơng pháp hƣớng tiếp cận thủ công để
trích từ cần dịch có trên biển chỉ dẫn.
Để sử dụng phƣơng pháp này ta dùng chuột để để khoanh vùng cần trích.
Bƣớc 3: Tiến hành tách ảnh ký tự trong vùng đã khoanh đƣợc đêm lƣu vào
mảng. Tạm gọi mảng đó là mảng A.
Để sử dụng phƣơng pháp này ta dùng thƣ viện mã nguồn mở OPENCV
và sử dụng hàm của nó và 1 ít đặc điểm của ký tự vào để dễ dàng tách ký tự hơn.
Bƣớc 4: Mang từng ảnh ký tự đó thực hiện nhận dạng bằng thuật toán.
Thật toán để giải quyết: có rất nhiều thuật toán để giải quyết vấn đề này,
nhƣ thuật toán nơron, máy học SVN. Nhƣng bài luận này chủ yếu để nghiên cứu
về thuật toán PCA (Phân tích thành phần chính). Ta sẽ tiến hành nhận dạng bằng


Đồ án tốt nghiệp


1.7 BỐ CỤC LUẬN VĂN
Bố cục luận văn gồm:
Chƣơng 1. Tổng quan về đề tài


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

Nội dung chủ yếu của chƣơng này là giới thiệu khái quát về các vấn đề cần
thực hiện, các mục tiêu, ý nghĩa mà đề tài hƣớng đến. Đề ra các phƣơng pháp giải
quyết. Chọn phƣơng pháp giải quyết thích hợp cho luận văn.
Chƣơng 2. Cơ sở lý thuyết
Nội dung nghiên cứu lý thuyết liên quan đến quá trình thực hiện đề tài bao
gồm: Lý thiết về xử lý ảnh, Lý thuyết về thƣ viện OpenCV trong nhận dạng, lý
thuyết về hệ quản trị cơ sở MySQL, Lý thuyết về thuật toán PCA.
Chƣơng 3. Thực nghiệm
Nội dung về các bƣớc tiếp cận lý thuyết và áp dụng vào bài toán đã đặt ra.
Nêu ra từng bƣớc một triển khai và kết quả sơ khai của chƣơng trình.
Chƣơng 4. Kết luận và hƣớng phát triển
Nội dung rút ra đƣợc trong quá trình giải quyết bài toán. Những cái giải
quyết đƣợc và những cái chƣa giải quyết đƣợc. Đặt ra hƣớng phát triển hoặc hƣớng
đi mới cho bài luận.


Đồ án tốt nghiệp

Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA

KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN


Hoàn thành

Nhận dạng ký tự bằng PCA

Hoàn thành

Thao tác truy vấn và dịch sang
tiếng việt

Hoàn thành

Xử lý xoay ảnh khi ảnh bị
nghiêng

Cần sự hổ trợ và

Cơ sở dữ liệu
MySql

Chƣa hoàn thành

Dựa vào bảng chức năng liệt kê ở trên cho thấy chƣơng trình tƣơng đối hoàn
chỉnh.
Đồng thời với việc thực hiện chƣơng trình rút ra đƣợc ƣu và nhƣợc điểm của
thuật toán PCA trong nhận dạng ký tự.

1.8.2 Hạn chế
Độ chính xác của chƣơng trình nhận dạng biển chỉ dẫn còn phụ thuộc vào
chất lƣợng của ảnh. Tuy nhiên yếu tố này ta có thể điều chỉnh đƣợc bằng cách nâng


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status