TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CHUYÊN ĐỀ
Học phần: Những vấn đề mới trong công nghệ thông tin
và truyền thông
NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH
Nhóm học viên:
Trịnh Xuân Tiến
Lê Thị Nguyệt
Nguyễn Thị Huyền Trang
Bắc Ninh, tháng 9 năm 2017
TRƯỜNG ĐẠI HỌC KỸ THUẬT - HẬU CẦN CAND
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO CHUYÊN ĐỀ
Học phần: Những vấn đề mới trong công nghệ thông tin
và truyền thông
NHẬN DẠNG BIỂN SỐ XE TỪ DỮ LIỆU HÌNH ẢNH
GIÁO VIÊN HƯỚNG DẪN: TS. Lương Khắc Định
Nhóm học viên:
1.1. Tổng quan về nhận dạng ........................................................................................3
1.1.1. Khái niệm nhận dạng.............................................................................................3
1.1.2. Không gian biểu diễn đối tượng, không gian diễn dịch ........................................3
1.1.3. Mô hình và bản chất của quá trình nhận dạng .....................................................4
1.2. Xử lý ảnh .................................................................................................................6
1.2.1. Quá trình xử lý ảnh................................................................................................ 6
1.2.2. Các vấn đề cơ bản trong xử lý ảnh ........................................................................8
1.3. Công nghệ Tesseract OCR .....................................................................................9
1.3.1. Lịch sử ...................................................................................................................9
1.3.2. Kiến trúc hoạt động ............................................................................................. 10
CHƯƠNG 2. BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE ...........................................11
2.1. Nhận dạng biển số xe ............................................................................................ 11
2.1.1. Khái niệm .............................................................................................................11
2.1.2. Phân loại biển số xe ............................................................................................ 12
2.1.3. Những quy định về màu sắc và chữ số đặc biệt ..................................................13
2.2. Hướng giải quyết ..................................................................................................15
2.2.1. Hướng tiếp cận phát triển vùng ...........................................................................15
2.2.2. Hướng tiếp cận dò biên và biến đổi Hough ........................................................15
2.2.3. Hướng giải quyết .................................................................................................16
2.3. Phát hiện vùng chứa biển số xe ...........................................................................17
2.4. Xác định chính xác vùng chứa biển số xe ...........................................................19
2.5. Nhận dạng ký tự ...................................................................................................20
2.5.1. Mô hình mạng notron nhân tạo ...........................................................................20
2.5.2. Phương pháp và thuật toán nhận dạng kí tự .......................................................24
CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH NHẬN DẠNG BIỂN SỐ XE .......28
3.1. Công cụ xây dựng .................................................................................................28
3.1.1. Microsoft Visual Studio 2013 ..............................................................................28
3.1.2. Microsoft .Net framework ....................................................................................28
3.2. Chương trình nhận dạng biển số xe....................................................................29
3.2.1. Giao diện chính của phần mềm ...........................................................................29
iii
MỞ ĐẦU
1. Tên đề tài
“Nghiên cứu nhận dạng biển số xe từ dữ liệu hình ảnh”
2. Lý do chọn đề tài
Cùng với sự phát triển của khoa học kỹ thuật và nhu cầu đi lại ngày càng tăng,
số lượng phương tiện giao thông trên đường ngày càng xuất hiện nhiều. Với số lượng
phương tiện giao thông lớn, và còn không ngừng tăng lên như vậy đã làm nảy sinh
nhiều vấn đề trong việc kiểm soát các phương tiện cũng như công tác quản lý, xử lý vi
phạm giao thông mà nguồn nhân lực con người khó có thể thực hiện được. Để giải
quyết vấn đề này nhu cầu đặt ra là phải áp dụng các26 hệ thống quản lý, xử lý vi phạm
giao thông tự động.
Để xây dựng hệ thống quản lý giao thông tự động thì “Bài toán nhận dạng biển
số xe” là tiền đề để xây dựng mô hình quản lý đó, nhưng hiện nay ở Việt Nam những
hệ thống quản lý đó còn chưa nhiều và lĩnh vực nhận dạng đang còn trong quá trình
phát triển.
Từ những thực tế đó, trong thời gian học môn những vấn đề mới trong công
nghệ thông tin, em đã quyết định lựa chọn tìm hiểu về đề tài: “Nghiên cứu nhận dạng
biển số xe từ dữ liệu hình ảnh”.
3. Mục tiêu nghiên cứu
Chúng em thực hiện đề tài: “Nhận dạng biển số xe từ dữ liệu hình ảnh” với mục
tiêu cụ thể như sau:
- Tìm hiể u về quá trình xử lý và nhận dạng ảnh.
- Tìm hiểu công nghệ Tesseract OCR.
- Xây dựng phần mềm nhận dạng biển số xe từ dữ liệu hình ảnh.
4. Phương pháp nghiên cứu
- Phương pháp nghiên cứu tài liệu: Nghiên cứu tài liệu có liên quan đến đề tài
3.2. Chương trình nhận dạng biển số xe
3.3. Đánh giá sản phẩm Demo
2
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT VỀ NHẬN DẠNG TỪ DỮ LIỆU HÌNH ẢNH
1.1. Tổng quan về nhận dạng
1.1.1. Khái niệm nhận dạng
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô
hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo
những quy luật và mẫu chuẩn. Quá trình nhận dạng dựa vào những mẫu học biết trước
gọi là nhận dạng có giám sát (supervised learning), trong trường hợp ngược lại gọi là
học không có giám sát (non supervised learning).
1.1.2. Không gian biểu diễn đối tượng, không gian diễn dịch
Không gian biểu diễn đối tượng
Các đối tượng khi quan sát hay thu nhập được thường được biểu diễn bởi tập
các đặc trưng hay đặc tính. Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng
cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính, được biểu diễn bởi
các đặc trưng như biên, miền đồng nhất…. Người ta thường phân các đặc trưng này
theo các loại như: đặc trưng tô pô (tập điểm), đặc trưng hình học và đặc trưng chức
năng. Việc biểu diễn ảnh theo đặc trưng nào còn phụ thuộc vào ứng dựng tiếp theo.
Ví dụ : giả sử đối tượng X (ảnh, chữ viết, dấu vân tay,…) được biểu diễn bởi n
thành phần đặc trưng: 𝑋 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }; mỗi 𝑥𝑖 biểu diễn một đặc tính. Không gian
biểu diễn đối tượng thường gọi tắt là không gian đối tượng A được định nghĩa:
𝐴 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }
Trong đó mỗi 𝑥𝑖 biểu diễn một đối tượng. Không gian này có thể là vô hạn,
nhưng để tiện xem xét thì ta chỉ xét tập hữu hạn.
Không gian diễn dịch
Không gian diễn dịch là tập các tên gọi của đối tượng. Kết thúc quá trình nhận
𝑁
1
𝑥0 = ∑ 𝑥𝑖
𝑁
𝑖=1
𝑁
𝑦=
1
∑ 𝑦𝑖
𝑁
𝑖=1
là tọa độ tâm điểm. Ta có moment trung tâm bậc p, q của đường bao như sau:
𝑁
𝜇𝑝𝑞
1
= ∑(𝑥𝑖 − 𝑥0 )𝑝 (𝑦𝑖 − 𝑦0 )𝑞
𝑁
𝑖=1
Vector tham số trong trường hợp này chính là các moment 𝜇𝑖𝑗 với i=1,2,…,p và
j=1,2,…,q.
Việc lựa chọn phương pháp biểu diễn sẽ làm đơn giản cách xây dựng nhưng
việc lựa chọn đặc trưng nào là hoàn toàn phụ thuộc vào ứng dụng. Trong nhận dạng
chữ, các tham số là các dấu hiệu: số điểm chạc ba, chạc tư, số điểm chu trình, số điểm
tượng vào một lớp hay nói một cách khác gán cho đối tượng một tên.
- Học có giám sát (supervised learning)
Kỹ thuật phân loại nhờ kiến thức biết trước gọi là học có giám sát.[1] Đặc điểm
cơ bản của kỹ thuật này là người ta có một thư viện các mẫu chuẩn. Mẫu cần nhận
dạng sẽ được đem so sánh với mẫu chuẩn để xem nó thuộc loại nào. Ví dụ như trong
một ảnh viễn thám, người ta muốn phân biệt một cách đồng lúa, một cánh rừng hay
một vùng đất hoang mà đã có miêu tả về đối tượng đó. Vấn đề chủ yếu là thiết kế một
hệ thống để có thể đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho
chúng vào một lớp. Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công
cụ gọi là hàm phân lớp hay hàm ra quyết định.
- Học không có giám sát (non supervised learning)
Kỹ thuật này phải tự định ra cách lớp khác nhau và xác định các tham số đặc
trưng cho từng lớp.[1] Học không có giám sát khó khăn hơn. Một mặt, do số lớp
không được biết trước, mặt khác những đặc trưng của lớp cũng không biết trước. Kỹ
thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất. Bắt đầu
5
từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt
được một phương án phân loại.
Ta có sơ đồ tóm tắt quá trình nhận dạng:
Hình 1.1. Sơ đồ quá trình nhận dạng
1.2. Xử lý ảnh
1.2.1. Quá trình xử lý ảnh
Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác
máy tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này. Hai nhiệm vụ cơ bản
của quá trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu
cung cấp cho các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra
Để nhận dạng chữ hoặc mã vạch trên phong bì thư cho mục đích phân loại bưu
phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ cái, chữ số
hoặc vạch riêng biệt để nhận dạng.
- Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau khi phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số liệu này thành
dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất
để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các
đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp
đối tượng này với đối tượng khác trong phạm vi nhận được.
Trong nhận dạng kí tự trên phong bì thư, chúng ta miêu tả các đặc trưng của
từng kí tự giúp phân biệt kí tự này với kí tự khác.
- Nhận dạng và nội suy ảnh (Image Recognization and Interpetation)
Nhận dạng ảnh là quá trình xác định ảnh thường thu bằng cách so sánh với mẫu
chuẩn đã được học hoặc lưu từ trước. Nội suy là phán đoán theo ý nghĩa trên cơ sở
nhận dạng. Một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy
thành mã điện thoại.
Có nhiều cách phân loại khác nhau về ảnh có thể phân theo hai loại nhận dạng
ảnh cơ bản là nhận dạng theo tham số và nhận dạng theo cấu trúc. Một số đối tượng
nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là
7
nhận dạng ký tự, nhận dạng văn bản, nhận dạng vân tay, nhân dạng mã vạch, nhận
dạng mặt người,…
- Cơ sở tri thức (Knowlegde Base)
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượn điểm
ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân
tích ảnh, ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý,
người ta mong muốn bắt chước quy trình tiếp nhận và xử lý theo phương pháp trí tuệ
8
với P=m*n là số điểm ảnh được xét
G là số mức xám được xét
∑𝑔𝑖=0 𝑖ℎ(𝑖) = ∑𝑔𝑖=0 𝑖𝑃(𝑖)
m(g) =
𝑡(𝑔)
là giá trị trung bình cấp xám g
𝑡(𝑔)
f(g) =
x [m(g) − m(G − 1)]2 − 1
𝑃 − 𝑡(𝑔)
Ta được: 𝜃 = argmax f(g) với 0 < g < G-1 là ngưỡng của ảnh cần tìm.
Biên (đường bao của ảnh): là tập hợp các điểm biên.[3] Một điểm ảnh có thể
coi là điểm biên nếu có sự thay đổi đột ngột và mức xám hay biên là điểm có cấp xám
có giá trị khác hẳn các điểm xung quanh.
1.3. Công nghệ Tesseract OCR
Nhận dạng kí tự quang học (Optical Character Recognition) là kỹ thuật được sử
dụng để chuyển đổi ảnh văn bản sang dạng văn bản có thể chỉnh sửa trong máy tính.
Đầu vào của quá trình này là tập tin hình ảnh và đầu ra sẽ là các tập tin văn bản chứa
nội dung là các chữ viết, kí hiệu có trong hình ảnh đó.[2]
1.3.1. Lịch sử
Tesseract là một phần mềm mã nguồn mở và ban đầu nó được nghiên cứu và
phát triển tại hãng Hewlett Packet (HP) trong khoảng từ năm 1984 đến 1994. Vào năm
1995, Tesseract nằm trong nhóm 3 bộ nhận dạng OCR đứng đầu về độ chính xác khi
tham gia trong hội nghị thường niên của tổ chức UNLV.
Vì Tesseract hiện nay là bộ thư viện mã nguồn mở hoàn toàn miễn phí nên trên
thế giới đã có nhiều phần mềm nhận dạng kí tự quang học ra đời dựa trên bộ Tesseract
với giao diện và các tính năng dễ sử dụng hơn so với giao diện đơn giản của Tesseract
26
0.75
5.78
Tiếng Hoa
giản thể
0.25
Không xác
định
3.77
Không xác
định
Tiếng Hindi
1.4
0.33
15.41
69.44
CHƯƠNG 2. BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE
2.1. Nhận dạng biển số xe
2.1.1. Khái niệm
Hệ thống nhận dạng biển số xe là hệ thống có khả năng phân tích hình ảnh và
xác định biển số xe, thông qua video, thiết bị ghi hình và hình ảnh. Sau cùng là xác
định các thông tin như chủ sở hữu xe, theo dõi xe với tốc độ chậm.
Ứng dụng nhận dạng biển số xe là ứng dụng có khả năng phân tích hình ảnh và
xác định biển số xe từ các hình ảnh chụp được từ các thiết bị thu hình. Nguồn hình ảnh
cho ứng dụng có rất nhiều và phát triển hơn là trực tiếp thu từ camera.
Có nhiều cách thức khác nhau để phân loại các ứng dụng nhận dạng biển số xe.
Một trong những cách đơn giản là phân loại ứng dụng nhận dạng biển số xe thông qua
mục đích sử dụng. Có thể chia ứng dụng nhận dạng biển số xe thành hai loại sau:
Loại 1: Giới hạn vùng nhìn
Đầu vào: Ảnh thu trực tiếp từ các thiết bị, ghi nhận ảnh kỹ thuật số. Ảnh được
ghi nhận thường chi giới hạn trong vùng có biển số xe.
Nguyên lý hoạt động: Các phương tiện giao thông phải chạy với một tốc độ đủ
chậm để máy ghi nhận hình ảnh có thể thu được ảnh vùng biển số xe.
Ứng dụng: Những ứng dụng nhận dạng biển số xe loại này thường được dùng
tại các trạm kiểm soát các trạm thu phí, các bãi gửi xe tự động, các trạm gác cổng…
Loại 2: Không giới hạn vùng nhìn
Đầu vào: ảnh đầu vào thu được từ thiết bị ghi hình tự động, không phụ thuộc
vào góc độ, các đối tượng xung quanh, ảnh không cần bắt buộc chỉ chụp vùng chứa
biển số xe, mà có thể là ảnh tổng hợp như chứa thêm các đối tượng như người, cây,
đường phố…, miễn là vùng biển số phải đủ rõ để có thể nhận dạng được ký tự trong
vùng đó.
Nguyên lý hoạt động: do đặc tính không giới hạn vùng nhìn mà ảnh đầu vào có
thể thu được từ một thiết bị ghi hình (camera, máy ảnh). Và do đó, công việc đầu tiên
là dò tìm trong ảnh, để xác định đúng vùng nào là biển số xe. Sau đó, thực hiện tách
Ngoài ra, hệ thống còn được ứng dụng vào công tác chống trộm xe, các bãi giữ
xe tự động, điều tiết giao thông,…
2.1.2. Phân loại biển số xe
Quy định biển số của 63 tỉnh thành (Biển đen chữ trắng)
11- Cao Bằng
12 - Lạng Sơn
14 - Quảng Ninh
15,16 - Hải Phòng
38 - Hà Tĩnh
43 - Đà Nẵng
47 - Đắc Lắc
48 - Đắc Nông
76 - Quảng Ngãi
77 - Bình Định
78 - Phú Yên
79 - Khánh Hòa
17 - Thái Bình
18 - Nam Định
19 - Phú Thọ
20 - Thái Nguyên
21 - Yên Bái
22 - Tuyên Quang
23 - Hà Giang
24 - Lào Cai
25 - Lai Châu
49 - Lâm Đồng
68 - Kiên Giang
90 - Hà Nam
28 - Hòa Bình
69 - Cà Mau
29, 30, 31, 32, 33 - 70 - Tây Ninh
Hà Nội
71 - Bến Tre
92 - Quảng Nam
93 - Bình Phước
94 - Bạc Liêu
34 - Hải Dương
35 - Ninh Bình
72 - Bà Rịa - Vũng Tàu
73 - Quảng Bình
95 - Hậu Giang
97 - Bắc Cạn
36 - Thanh Hóa
37 - Nghệ An
74 - Quảng Trị
75 - Huế
98 - Bắc Giang
+ TK: Tổng cục công nghiệp quốc phòng.
+ TT: Tổng cục kỹ thuật.
+ TM: Bộ tổng tham mưu.
+ VT: Viettel.
+ BL: bộ tư lệnh 969.
- Màu trắng 2 chữ, 5 số là biển dành cho người nước ngoài:
+ NG là xe ngoại giao.
+ NN là xe của các tổ chức, cá nhân nước ngoài: trong đó có 3 số ở giữa là mã
quốc gia, 2 số tiếp theo là số thứ tự.
Xe số 80 NG xxx-yy là biển cấp cho các đại sứ quán, thêm gạch đỏ ở giữa và
hai số cuối là 01 là biển xe của tổng lãnh sứ.
- Những xe mang biển 80 gồm có:
+ Các ban của Trung ương Đảng.
+ Văn phòng Chủ tịch nước.
+ Văn phòng Quốc hội.
+ Văn phòng Chính phủ.
+ Bộ Công an.
+ Xe phục vụ các đồng chí ủy viên Trung ương Đảng công tác tại Hà Nội và
các thành viên Chính phủ.
+ Bộ ngoại giao.
+ Viện kiểm soát nhân dân tối cao.
+ Tòa án nhân dân tối cao
+ Đài truyền hình Việt Nam.
+ Đài tiếng nói Việt Nam.
+ Thông tấn xã Việt Nam.
+ Báo nhân dân.
+ Thanh tra Nhà nước
+ Học viện Chính trị quốc gia.
xe.
Nhược điểm: khi ảnh có thêm nhiều đối tượng không phải là vùng biển số xe,
chẳng hạn là ảnh chụp tổng quát gồm cả cảnh vật bên ngoài thì cách tiếp cận này trở
nên không hiệu quả. Vì vậy, phương pháp này rất có hiệu quả đối với hệ thống trạm
thu phí, trạm gác cổng, gửi xe tự động.
2.2.2. Hướng tiếp cận dò biên và biến đổi Hough
Nhóm tác giả Michael Lindenbaum, Rosen Alexander, Vichik Sergey, Sandler
Roma được đại diện cho cách tiếp cận này.
Ý tưởng: Biển số xe được bao bọc bởi đường viền. Do đó, có thể dùng phương
pháp phát hiện biên, sau đó dùng phép biến đối Hough để trích những đoạn thẳng dọc,
15
ngang tồn tại trong ảnh. Giao điểm của những đoạn thẳng này chính là vùng bao chứa
biển số xe. Và cuối cùng là nhận dạng các ký tự ở trên mỗi vùng con.
Ưu điểm: độ chính xác cao. Và hệ thống nhận dạng đa phần đều phát triển theo
hướng tiếp cận này.
Nhược điểm: Độ phức tạp tính toán khá cao. Khi ảnh có thêm nhiều đối tượng
khác nhau thì khối lượng tính toán tăng lên rất nhiều. Do mục đích là phải xác định
được vùng con nào chứa biển số xe.
Ngoài hai cách tiếp cận phổ biến trên còn có nhiều các tiếp cận khác để xác
định chính xác vùng nào chứa biển số xe để tiến hành nhận dạng kí tự nhưng chủ yếu
là sử dụng cách tiếp cận biến đổi Hough.
2.2.3. Hướng giải quyết
Tiêu chuẩn về kích thước:
Ở mỗi nước thường có tiêu chuẩn về kích thước nhất định. Đối với nước ta,
biển số xe qui định khá đồng đều cho mỗi loại xe, tỷ lệ chiều dài, rộng cho mỗi loại xe
là như nhau.
Đối với loại xe có một hàng ký tự thì tỉ lệ dài/rộng là: 3.5 W / H 4.5.
Đối với loại xe có hai hàng ký tự thì tỉ lệ dài/rộng là: 0.8 W / H 1.4.
Hình 2.2. Các bước phát hiện vùng chứa biển số xe
Ảnh đầu vào là một ảnh có 256 mức xám, được nhị phân hóa thành ảnh nhị
phân. Mục đích của giai đoạn nhị phân hóa ảnh là nhằm làm nổi bật vùng biển số xư.
Khi ta tách biển, vùng bao của biển số xe sẽ hiện lên rõ ràng. Sau đó dùng phương
pháp phát hiện biên để có được biên dọc và ngang của ảnh.
Kết quả của công đoạn này thu được ảnh nhị phân chỉ chứa các cạnh dọc và
ngang. Thực hiện biến đổi Hough cho các đoạn biên vừa lấy được và xác định các
đoạn thẳng đi qua tập các điểm biên của mỗi biên, kết quả là các đoạn thẳng ngang và
dọc. Giao của những đoạn thẳng này sẽ cho ra vùng con 𝐼𝑐 .
Nhị phân hóa ảnh
Ảnh 256 mức xám luôn có sự thay dổi liên tục của các mức xám làm cho việc
xác định biên khó khăn và việc tìm ra các vùng liên tục của biên bị hạn chế. Vì vậy
phải thực hiện chuyển ảnh về dạng nhị phân để thực hiện việc lấy biên hiệu quả hơn.
17
Tách biên
Biển số xe có viền bao quanh nên cần làm nổi bật đường biên (Boundary) được xem là
các cạnh dọc và ngang. Mục đích của giai đoạn này là tách ra các cạnh dọc và ngang
để tìm ra vùng con chứa biển số xe nhờ tính giao điểm của các cạnh dọc và ngang. Vì
ảnh đầu vào là ảnh nhị phân nên thích hợp với phương pháp đạo hàm bậc nhất, sử
dụng 2 ma trận Sobel theo hai ngưỡng x (dọc) và y (ngang) để tách các cạnh của ảnh.
−1 0 1
−1 −2
𝐻1 = [−2 0 2]
𝐻2 = [ 0
0
−1 0 1
1
nhất. Để các đường thẳng dọc, ngang (từ ảnh cạnh dọc, ngang) có thể cắt nhau như
trong thực tế cần mở rộng các đoạn thẳng về 2 hướng mỗi đoạn 5 điểm nên đoạn thẳng
được sử dụng dài hơn khoảng 10 điểm so với đoạn thẳng thực tế.
Để tính số giao điểm của các đoạn thẳng ta chỉ cần tính số giao điểm của các
đường thẳng Hough và kiểm tra xem giao điểm đó có nằm trên đoạn thẳng được trích
18
họ ra hay không. Giao điểm của các đoạn thẳng là các vùng con 𝐼𝑐 có khả năng chứa
biển số xe.
2.4. Xác định chính xác vùng chứa biển số xe
Tập các vùng con 𝐼𝑐 có khả năng chứa biển số xe là các tứ giác. Số lượng các
vùng con này là khá nhiều, chưa đảm bảo chính xác vùng nào chứa biển số xe để thực
hiện nhận dạng ký tự nên phải loại bỏ đi những vùng con trong tập con 𝐼𝑐 không có
khả năng chứa biển số xe.
Xét sơ đồ xác định chính xác vùng chứa biển số xe:
Hình 2.3. Các bước xác định chính xác vùng chứa biển số xe
Trên thực tế, biển số xe trên thực tế có hình dạng là hình chữ nhật nên khi chụp
ảnh của biển số xe sẽ có dạng tựa hình bình hành. Trường hợp tối ưu là ảnh hình chữ
nhật. Do đó, trong quá trình xét duyệt các vùng con 𝐼𝑐 nếu hình nào không có hình
dạng tựa hình bình hành thì có thể loại bỏ ngay mà không cần xét đến.
Hình tứ giác tựa hình bình hành có những đặc điểm sau:
- Các góc không có nhỏ, có thể lấy ngưỡng là 45𝑜 .
- Hai góc đối không chênh lệch quá lớn, lấy ngưỡng là 30𝑜 .
Biển số xe phải có một diện tích nào đó và đủ lớn để có thể nhận diện ra ký tự
tồn tại trên đó. Vì vậy, những vùng con có diện tích nhỏ hơn một ngưỡng nào đó thì
loại bỏ và phải chú ý kích thước chiều dài, chiều rộng của vùng con 𝐼𝑐 .
Sau khi loại bỏ đi những vùng con theo hai tiêu chí trên ta thu được tập con 𝐼𝑐′ .