Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014
1
BIỂU DIỄN MỘT SỐ ĐẶC TRƯNG ẢNH ÁP DỤNG ĐỂ PHÂN LOẠI PHƯƠNG TIỆN GIAO THÔNG
TRONG VIDEO.
Nguyễn Văn Căn, Nguyến Đăng Tiến, Dương Phú Thuần, Trần Xuân Ban
Trường Đại học Kỹ thuật – Hậu cần CAND
, ,
TÓM TẮT- Mục đích của bài viết này là trình bày một
số phương pháp biểu diễn đặc trưng ảnh phục vụ cho
phát hiện và phân loại phương tiện giao thông từ
video: trích chọn đối tượng chuyển động bằng phương
pháp luồng quang học; biểu diễn hình dạng đối tượng;
biểu diễn đường viền trên trường số phức, biểu diễn
đường viền theo đỉnh hình dạng. Đề xuất một khung
làm việc chung cho hệ thống phân loại và xác định mật
độ phương tiện giao thông từ video trong vùng quan
sát.
Keywords: Optical Flow, Contour Analysis, Car
Counting, Shape Detection.
I. GIỚI THIỆU
Bài toán phát hiện và phân loại phương tiện giao
thông trong video có nhiều ý nghĩa trong thực tế
quản lý giao thông. Các tham số về phương tiện
giao thông, có nhiều ý nghĩa trong việc xác định
chứng cứ vi phạm luật giao thông, điều khiển giao
thông, giải quyết tranh chấp trong hiện trường tai
nạn Để đáp ứng điều kiện giao thông Việt Nam,
thông tin các xe tải. Kết quả thu được là độ chính
xác để phát hiện ra xe lên đến trên 97%, và tỷ lệ lỗi
khi đếm xe tải thấp hơn 9% trong cả ba lần thử
nghiệm. Tiếp cận theo hướng này, chủ yếu là phát
hiện được xe tải, xác định và phân hoạch được sự
khác biệt giữa 2-3 xe con nối tiếp nhau và xe tải
dài Chưa tiếp cận và nói đến việc nhận dạng và
đếm số lượng xe máy, xe thô sơ và người đi bộ.
Năm 2009, Umesh Narayanan [5] đã phát triển một
hệ thống phân loại và đếm số lượng phương tiện
dựa trên thị giác máy tính thông qua camera giám
sát. Phân loại từng xe qua sử dụng kích thước xe.
Độ chính xác thực nghiệm chứng minh khoảng
90%. Năm 2010, Chung-Cheng Chiu và cộng sự
[56], phát triển một hệ thống giám sát giao thông
thời gian thực, bao gồm phát hiện, nhận dạng và
theo dõi các phương tiện từ các ảnh chụp trên
đường. Phương pháp phân đoạn và nhận dạng sử
dụng chiều dài, chiều rộng và kích thước mui xe để
phân loại các phương tiện như xe tải lớn, xe con, xe
tải nhỏ hoặc các phương tiện lớn khác. Kết quả xác
định phát hiện các loại xe, từ xe tải to đến các xe
con, xe chuyên dùng mini, có độ chính xác phân
bố từ 90% đến 98%.
Các phần tiếp theo, chúng tôi tập trung vào biểu
diễn hình dạng đối tượng, đường viền đối tượng,
mục đích sử dụng cho phân loại phương tiện giao
thông, trong điều kiện mật độ phương tiện đông
đúc, đa dạng, có sự chồng lấp lên nhau về hình
dạng. Các phương pháp trích chọn luồng quang học,
(2)
D là số đối tượng phát hiện được.
Gọi
với ngưỡng cho trước là tập các kết quả
phát hiện “cũ”, được hiểu theo nghĩa, nếu một phát
hiện trong thời điểm t quá gần với một trạng thái đã
có tại thời điểm t-1 thì nó sẽ được xem là trùng với
phẳng với chiều dài ảnh Dh1 trên đường. Đường đứt
nét F là đường tâm của camera, Dh1 là chiều dài thị
giác của phương tiện phía trên đường đứt nét F. R
2
và R
1
là các chiều dài pixel trong ảnh phẳng, R
p
là
kích thước điểm ảnh của camera. H là độ cao của
camera, f là tiêu điểm của ống kính, θ là góc của
camera với mặt đường. Ta có:
(3)
Hình 1. Chiều dài giữa ảnh và đối tượng chuyển động
D
1
và D
2
có thể thu được từ các biểu thức:
cos
sin
1
cossinsincossin
1
1
1
1
1
p
p
p
p
RRf
RR
H
RRf
FRR
D
(6)
cossincossinsin
1
1
1
2
2
12
pp
p
RRf
R
RRf
R
HR
DDDh
(8)
Chiều dài ảnh Dh2 của ô tô phía dưới đường F
có thể tính bằng biểu thức:
D
H
R
Dw
f
DhF
Rw
Dw
w
cos
sin
1
cos1
1
(10)
f
D
đường tâm F.
Tính được các chiều dài và chiều rộng ảnh trung
bình của các xe khác nhau bằng các kiểm thử liên
tiếp. Mặc dù chiều cao của xe gây ra sai số không
đáng kể trong việc ước lượng chiều dài, nhưng vẫn
có thể xác định chính xác loại xe trên đường nhờ sử
dụng các tham số của nhà sản xuất.
C. Véc tơ hóa hình dạng đối tượng
Cho một bức hình chứa một đối tượng, với bố
cục nền không phức tạp, dễ dàng phát hiện được
biên đối tượng, và trích chọn nội dung đối tượng để
làm đặc trưng cho bức ảnh. Phương pháp biểu diễn
hình ảnh thông qua lược đồ khoảng cách thực hiện
dựa trên các hình đa giác và trọng tâm của đa giác,
trước khi đối tượng được biểu diễn thực hiện tìm
xấp xỉ của hình dạng đó (thuộc tính hình học).
a) Đường tròn gốc
b) Với 8điểm cơ bản
Hình 2. Mô tả hình dạng hình tròn
Hình 2 cho thấy, khi số lượng điểm cơ bản trên
biên của hình tròn càng tăng thì hình mô tả sẽ gần
giống hơn đối với hình ảnh gốc, và các điểm biên cơ
bản này luôn được căng đều trên biên, đồng thời
dây cung nối giữa các điểm này sẽ tạo lên đường
mô phỏng hình dạng gốc.
Công việc xác định điểm cơ bản được thực hiện
bằng cách, duyệt lần lượt các điểm ảnh biên theo
thứ tự ngược hoặc xuôi chiều kim đồng hồ. Thu
n
,y
0
=y
n.
Hình 3. Đa giác có n cạnh
Diện tích của đa giác:
(13)
Áp dụng định lý Green trên mặt phẳng, xác định
tọa độ trọng tâm của đa giác:
i
= (x
i
,y
i
)
và trung tâm đa giác có tọa độ c=(x
c
,y
c
), được tính
theo công thức Ơclit:
(17)
Chuẩn hóa. Gọi D[i] là tập giá trị khoảng cách từ
tâm C đến các điểm mẫu trên biên. Ta có tập DS
(chuẩn hóa) được chuẩn hóa như sau:
(18)
Sau quá trình chuẩn hóa, tất cả khoảng cách
chuẩn hóa thu được sẽ nằm trong khoảng [0,1]. Bởi
vì việc gán điểm mẫu dựa trên chiều dài của biên,
và căng đều chúng trên biên, hai đa giác có kích
thước khác nhau nhưng hình dạng giống nhau sẽ
sinh ra giá trị khoảng cách chuẩn hóa. Do đó,
phương pháp này là bất biến đối với tỷ lệ sau khi
chuẩn hóa.
Đo độ tương tự. Lược đồ khoảng cách của một đa
giác có thể được mô tả bằng: (d
0
2n
), có độ tương tự được tính
theo khoảng cách ơ-clit:
(19)
Biểu diễn hình dạng đối tượng theo trọng tâm và
khoảng cách từ tâm đến biên đối tượng, áp dụng các
tính chất bất biến quay, bất biến tỷ lệ của mô-men
mang đến khả năng nhận dạng và phân loại đối
tượng theo hình dạng. Điều này có thể áp dụng phân
loại phương tiện giao thông trên đường trong trường
hợp đông đúc, có sự chồng lấp lên nhau về hình
dạng sau khi thực hiện phát hiện khối chuyển động.
Trong điều kiện giao thông đô thị đông đúc, các xe
tên vector cơ sở (EV). Và chuỗi giá trị các số phức
Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk,30-31/10/2014
4
gọi là vector đường viền (VC). Vector đường viền,
ký hiệu bằng chữ cái Γ, và vector cơ sở ký hiệu là .
Như vậy, vector đường viền Γ có độ dài k có thể
được xác định là:
(20) Hình 4. Biểu diễn đường viền bằng véc tơ số phức
Thao tác trên đường viền như là thao tác trên
véc tơ số phức có chứa nhiều đặc tính toán học hơn
là các mã biểu diễn khác. Về cơ bản, mã số phức là
gần với mã hai chiều khi mà đường viền được định
nghĩa phổ biến bằng véc tơ cơ bản trong tọa độ 2
chiều.
Đặc tính của đường viền
1. Tổng các EV của một đường viền kín bằng 0.
2. Véc tơ đường viền thì không phụ thuộc vào
phép chuyển vị song song của ảnh nguồn.
3. Quay ảnh theo một góc độ nào đó tương
đương với quay mỗi EV của đường viền trên cùng
góc độ đó.
4. Việc thay đổi điểm khởi đầu tiến hành theo
vòng tròn VC.
5. Thay đổi tỷ lệ ảnh nguồn có thể được coi là
Nếu tích càng lớn, góc càng nhỏ giữa các vector,
thì các vector này sẽ càng gần nhau. Với những
vector vuông góc, tích này bằng 0, và hơn nữa có
thể nhận giá trị âm cho những vector có hướng khác
nhau theo cách này. Tích vô hướng (21) cũng có các
đặc tính tương tự.
Tích vô hướng chuẩn hóa (NSP):
(22)
|Γ| và |N| - Tiêu chuẩn (chiều dài) của đường
viền được tính bằng công thức:
của đường viền
E. Biểu diễn đường viền theo đỉnh hình dạng
Về cơ bản, mô hình biểu diễn hình dạng tổng
quát GDM (Genaral Deformable Model) là một mô
hình hình chữ nhật 3-D với 8 đỉnh. Các đỉnh hình
dạng của xe được xấp xỉ tương ứng trên các đỉnh
của một hình hộp 3-D. Dựa vào mô hình này có thể
suy diễn ra những điểm che khuất của đường viền
một khối các phương tiện có chứa sự chồng lấp.
Mô hình đỉnh hình dạng VSM (Vertex Shape
Model) là thiết lập mối quan hệ giữa vị trí quan sát
camera (Q
c
= [X
c
Y
c
Z
c
]
T
) và số các đỉnh n
v
trên
đường viền GDM, biểu diễn như trên một bức ảnh
(hình 7).
Vì mỗi GDM có 8 đỉnh trong 3-D và 6 đỉnh
trong trong 2-D, n
v
là một trong số (6, 5, 4). Để thu
Vị trí trong không gian đường bao bởi 4 P
e
i
và
bề mặt của GDM (hình 3-10a)
hoặc Vị trí một của P
e
i
và đường bao của 2 P
e
i
khác được phân tách bởi GDM (hình 3-10b)
4
hoặc Vị trí của một P
e
i
nhưng không bao 2 P
e
i
khác được phân tách bởi GDM (hình 3-10d)
5
Còn lại
6
Mô hình CDM (Contour Description Model)
biểu diễn một tập hợp các hướng nguyên thủy để
mô tả những phác thảo của hình chiếu GDM đối với
các điểm biến mất p
z
với “a” biểu thị đường cắt
với p
y
khi nó kéo ra vô cùng, và hướng của đường
kéo ra xa từ p
y
khi GDM xoay theo chiều kim đồng
hồ.
(a) Kiểu S
4
(b) kiểu S
5
(c) Kiểu S
61
(d) kiểu S
62Hình 8. Kiểu hình dạng của hình chiếu biểu diễn hình học
tổng quát GDM.
.
c) hình b không thể
phân giải.
d) n
p
= 1 và n
occ
= 0 trong S
4
.
e) hình d phân giải lại.
Hình 10. Khả năng phân giải của S
4
.
Có 3 trạng thái có thể xảy ra trên mỗi đường của
4 kiểu hình dạng được giới thiệu trong phần trước
(S
4
, S
5
, S
6,1
và S
6,2
). Để lấy được tập quy tắc mô
hình phân giải GDM, phải tổng hợp tất cả các kết
hoặc nguồn video chất lượng thấp, hoặc mức độ dày
đặc của dòng phương tiện thì phương pháp lồng
quang học kết hợp tái chọn mẫu đạt được độ ổn
định qua bảng đánh giá sau:
Bảng 2. So sánh phản ứng của phương pháp với mật độ xe trên
các cung đường
Cung
đường
Số
frames
Mật độ
xe
Số
lượng
thực
Số
lượng
đêm
Độ
chính
xác
Cầu Như
Quỳnh
1450
Rất
thưa
35
35
100%
dài trung bình một số loại xe của nhà sản xuất trong
bảng được so sánh trong bảng 3.
Bảng 3. So sánh tham số kích thước xe với thực tế
Rộng
Dài
Cao
BMW ước tính
1.67
4.25
1.35
BMW thực
1.74
4.47
1.41
Chênh lệch
0.47
0.22
0.06
Tỷ lệ lỗi (%)
4.02
4.92
4.26
IV. KẾT LUẬN VÀ BÀN LUẬN
Bài báo đã trình bày tổng quan về một số đặc
trưng của phương tiện trích chọn từ video giao
thông. Đề xuất một số phương pháp biểu diễn đặc
trưng phương tiện sử dụng cho mục đích xác định
mật độ và phân loại. Bao gồm:
[3] Xue Mei, Shaohua Kevin Zhouy, Hao Wu, Fatih
Porikliz (2007), “Integrated Detection, Tracking and
Recognition for IR Video-based Vehicle
Classification”, Journal of computers (Vol.2, No.6).
[4] Chung-Cheng Chiu, Min-yu Ku và Chun-Yi Wang
(2010), Automatic Traffic Surveillance System for
Vision-Based Vehicle Recognition and Tracking.
Department of Electrical and Electronic Engineering,
Chung Cheng Institute of Technology National,
Defense University Taoyuan, Taiwan.
[5] G. S. K. Fung, N. H. C. Yung, and G. K. H. Pang,
“Close range Camera calibration” Opt. Eng. SPIE,
vol. 42, no. 10, pp. 2967–2977, Oct. 2003.
[6] C. C. C. Pang, W. W. L. Lam, and N. H. C. Yung, “A
novel method for resolving vehicle occlusion in a
monocular traffic-image sequence” IEEE Trans.
Intell. Transp. Syst., vol. 5, no. 3, pp. 129–141, Sep.
2004.
[7] Nguyễn Văn Căn, Nguyễn Đăng Tiến, Phạm Việt
Trung. “Phương pháp biểu diễn đường viền trên
trường số phức, áp dụng cho bài toán phân loại
phương tiện giao thông”. Tạp chí Khoa học và Công
nghệ quân sự. (Tháng 08/2014).