Bộ GIáO DụC V ĐO TạO Bộ QUốC PHòNG
HọC VIệN Kỹ THUậT QUÂN Sự
Lơng Xuân Cơng
nghiên cứu kỹ thuật phân đoạn dữ liệu video
trong môi trờng đa phơng tiện Chuyên ngành: Kỹ thuật điện tử
Mã số: 62.52.70.01 tóm tắt luận án tiến sĩ kỹ thuật H NộI - 2008
Công trình đợc hoàn thành tại Học viện Kỹ thuật Quân sự
Ngời hớng dẫn khoa học:
Công nghệ, Đại học Quốc gia Hà Nội, T. XIX, N.3, (2003), tr. 48 - 56).
2. Lơng Xuân Cơng (2005), Giải quyết một số vấn đề của thuật toán
phân đoạn dữ liệu video, Báo cáo khoa học tại Hội thảo khoa học ứng
dụng đa phơng tiện trong truyền bá văn hoá cổ truyền, thành viên tham
gia đề tài nhánh KC .01 .14 . 05 do PGS. TS Đỗ Trung Tuấn chủ trì, 2001 -
2005, thuộc đề tài cấp nhà nớc KC .01 .14 do PGS. TSKH Nguyễn Cát Hồ
chủ trì (đã nghiệm thu năm 2006).
3. Lơng Xuân Cơng, Đỗ Xuân Tiến, Đỗ Trung Tuấn (2006), Một kỹ
thuật chỉ số hoá tự động dữ liệu video dựa trên đánh dấu vùng nền, Tạp
chí khoa học - Chuyên san Khoa học Tự nhiên và Công nghệ, Đại học
Quốc gia Hà Nội, T.XXII, N.2, tr. 01 - 11.
4. Lơng Xuân Cơng, Đỗ Xuân Tiến, Đỗ Trung Tuấn (2006), Phơng
pháp khắc phục vấn đề chuyển động của camera và đối tợng trong phát
hiện các chuyển lia video, Tạp chí Khoa học và Kỹ thuật, Học viện Kỹ
thuật Quân sự, Số 117 / IV - 2006, tr. 28 - 40.
5. Lơng Xuân Cơng, Đỗ Trung Tuấn (2006), Thuật toán cho phép nâng
cao khả năng phân đoạn dữ liệu video, Tạp chí khoa học - Chuyên san
Khoa học Tự nhiên và Công nghệ, Đại học Quốc gia Hà Nội, T.XXII, N.3,
tr. 13 - 24.
6. L
ơng Xuân Cơng, Đỗ Xuân Tiến, Đỗ Trung Tuấn (2007), Phơng
pháp phát hiện các chuyển lia phức tạp dựa trên ớc lợng chuyển động
trong các khung video, Chuyên san Các công trình nghiên cứu khoa học
- nghiên cứu triển khai Công nghệ thông tin - truyền thông, Tạp chí Bu
chính Viễn thông và Công nghệ Thông tin, Kỳ 3 / 02 - 2007, tr. 15 - 24.
7. Lơng Xuân Cơng, Đỗ Xuân Tiến, Đỗ Trung Tuấn (2007), Chuẩn bị dữ
liệu trong việc xây dựng cơ sở dữ liệu video số, Tạp chí Tin học và Điều
khiển học, Viện Khoa học và Công nghệ Việt Nam, T.23, S.2, tr. 141 - 152.
- 1 -
4. Phơng pháp nghiên cứu
Dựa trên phơng pháp mô hình hoá, sử dụng các công cụ toán học (giải
tích, thống kê) để tính toán. Sử dụng phơng pháp thực nghiệm, dùng các
kết quả xử lý dữ liệu v phân đoạn video để kiểm chứng, đánh giá các thuật
toán đã xây dựng.
5. ý nghĩa khoa học v thực tiễn
Các mô hình v phơng pháp phân đoạn dữ liệu video trình by trong
luận án góp phần hệ thống hoá lý thuyết CSDL video, cung cấp các thuật
toán v công cụ cho chuẩn bị dữ liệu trong xây dựng các CSDL video số
trong môi trờng đa phơng tiện trong thực tế.
- 2 - 6. Bố cục của luận án
Luận án gồm 4 chơng với các phần mở đầu, kết luận, danh mục (07) các
công trình v bi báo khoa học đã đợc công bố của tác giả v phần phụ lục.
Chơng 1: Tổng quan về kỹ thuật phân đoạn dữ liệu video trong môi
trờng đa phơng tiện
Nội dung chính của chơng 1 đã đợc công bố trong bi báo 1.
Chơng 2: Phân đoạn dữ liệu video
Nội dung chính của chơng 2 đã đợc công bố trong bi báo 2.
Chơng 3: Các kỹ thuật phát hiện chuyển lia video mới
Nội dung chính của chơng 3 đã đợc công bố trong các bi báo 3, 4,
5, 6, 7.
Chơng 4: Thực nghiệm phân đoạn video
Nội dung chính của chơng 4 đã đợc công bố trong bi báo 5.
Chơng 1: tổng quan về kỹ thuật phân đoạn dữ liệu
video trong môi trờng đa phơng tiện
Hình 1.2. Các thao tác của hệ quản trị CSDL đa phơng tiện trên mạng
Một hệ quản trị CSDL đa phơng tiện luôn cần khả năng thao tác dữ liệu
trên mạng. Hình 1.2 l ví dụ một ứng dụng đa phơng tiện sử dụng các
dịch vụ của hệ quản trị CSDL để thu hồi các đối tợng từ CSDL, thao tác
v truyền tải trên mạng v trình by chúng tại trạm ngời dùng.
1.1.3. Dữ liệu video
Video đóng vai trò trung tâm trong hệ thống đa phơng tiện. Dữ liệu
video l loại dữ liệu đa phơng tiện đặc biệt với những đặc tính nổi bật:
kích thớc lớn, nội dung ngữ nghĩa trừu tợng, có tính không gian - thời
gian, yêu cầu tốc độ xử lý cao Đặc tính duy nhất của dữ liệu video, so với
các dạng dữ liệu khác, đợc tóm tắt ở bảng 1.1 [13].
Hình 1.3. Kiến trúc của
một hệ CSDL video
Bảng 1.1. So sánh dữ liệu video với
các dạng dữ liệu khác
Nội dung của dữ liệu video rất giu thông tin v có thể đợc xem xét
dới các khía cạnh: (i) nội dung ngữ nghĩa (nội dung mức cao); (ii) nội
dung hình ảnh, âm thanh (nội dung mức thấp); (iii) nội dung văn bản.
1.1.4. Kiến trúc của hệ cơ sở dữ liệu video
Hình 1.3 l kiến trúc của một hệ CSDL video điển hình.
1.1.5. Một số chức năng của hệ quản trị cơ sở dữ liệu video
Ngoi các chức năng nh các hệ quản trị CSDL truyền thống, hệ quản trị
CSDL video còn có một số chức năng riêng:
- 4 - - Mô hình hoá dữ liệu video liên quan đến vấn đề trình by dữ liệu
quan hệ theo
thời gian của
các cảnh
- 5 - 1.2.2. Các mô hình dữ liệu video
Một số mô hình dữ liệu video điển hình đã đợc phát triển: mô hình dựa
trên phân đoạn video; mô hình dựa trên phân lớp chú thích; mô hình đối
tợng video; mô hình dữ liệu video đại số. Tóm tắt các mô hình dữ liệu
video nh trên hình 1.9.
Hình 1.9. Phân loại các mô hình dữ liệu video
1.3. Phân đoạn v tóm tắt dữ liệu video
1.3.1. Các dạng chuyển lia video
Quá trình lấy mẫu theo thời gian trên nội dung của dữ liệu video [21]
nhờ phân tích nội dung hình ảnh của video v chia nó thnh một tập đơn vị
cơ sở (các lia) gọi l phân đoạn dữ liệu video.
Sự chuyển đổi giữa các lia video (gọi tắt l chuyển lia) có thể l đột ngột
hoặc từ từ. Ví dụ một số dạng chuyển lia nh trên hình 1.10.
Hình 1.10. Ví dụ về các thay đổi cảnh đột ngột (a) v từ từ (b, c, d, e, f)
1.3.2. Phát hiện chuyển lia video
Các thuật toán phân đoạn video có thể chia thnh hai nhóm:
- Các thuật toán dựa trên nội dung video mức thấp;
- Các thuật toán dựa trên nội dung mức cao.
1.3.3. Tóm tắt video
Tóm tắt video l quá trình tóm lợc bằng hình ảnh của một chuỗi video,
đợc trình by dới dạng cô đọng, loại trừ hoặc giảm bớt tối đa sự d thừa
* Đối sánh mẫu: So sánh các pixel hai ảnh ở những vị trí tơng ứng:
)],(),([),(
,
0,0
yxIyxIIId
j
NyMx
yx
iji
=
<<
==
(2.39)
trong đó kích thớc ảnh l MìN.
* Biểu đồ mu: Biểu đồ mu của ảnh đợc
tính bằng cách chia một không gian mu, ví
dụ RGB, thnh các mu ảnh riêng rẽ, gọi l
bin v đếm số pixel nằm trong mỗi bin [11],
[50]. Độ lệch giữa hai ảnh Ii v Ij trên cơ sở
biểu đồ mu của chúng Hi v Hj, biểu diễn
nh sau:
][),(
1
jk
n
k
ikji
HHIId =
* Biểu đồ
2
: Tính độ lệch số đo giữa hai khung nh sau:
=
+
=
K
k
ji
ji
kHkH
kHkH
0
2
2
2
))()((
))()((
(2.42)
Dùng biểu đồ mu
2
cho kết quả tốt hơn hai phép đo trên.
2.2. Phân đoạn dữ liệu video
2.2.1. Cấu trúc của một dòng video
Hình 2.4 mô tả cấu trúc phân cấp của dòng video điển hình [19]. Các
lớn hơn một ngỡng coi nh chứa một cắt lia. Có nhiều đặc tính v phép đo
đợc sử dụng để phát hiện cắt lia [26], [43].
* Các so sánh mức pixel
Cách đơn giản nhất để định lợng sự khác nhau giữa hai khung l so
sánh giá trị cờng độ sáng của các pixel tơng ứng. Nếu thay đổi tuyệt đối
trung bình cờng độ sáng của các pixel lớn hơn một ngỡng
cut
T thì sẽ coi
nh có một cắt lia xuất hiện giữa hai khung [51]. Với hai khung
1n
f v
n
f ,
có thể biểu diễn điều ny nh sau:
>
)(
)(
.
)()(
1
bT
n
có đợc bằng cách đếm số pixel trong khung
n
f với
mức xám k. Theo đó sự khác nhau giữa hai biểu đồ đợc xác định:
=
=
K
k
nnn
kHkHDH
1
1
)()(
(2.44)
Trong đó K l số mức xám. Nếu
n
DH lớn hơn một ngỡng, có một cắt lia.
Các tác giả khác vẫn sử dụng biểu thức (2.44), nhng tính
)(kH
n
bằng
cách đếm số pixel với mã mu k. Họ sử dụng một mã mu 6 bit có đợc
bằng cách lấy 2 bit có ý nghĩa nhất của mỗi thnh phần mu RGB trong mã
64 mu. Để sự khác nhau giữa hai khung chứa cắt lia phản ánh rõ rng hơn,
họ sử dụng số thống kê
2
; sự giao nhau biểu đồ:
kw
kHkH
INT
K
k
nn
n
.
))(),(min(
1
1
=
=
(2.46)
Trong đó
hw. l số pixel trong mỗi khung. Sự khác nhau giữa hai khung
đợc xác định bởi:
nn
INTINTD
=
1 (2.47)
* Các so sánh dựa trên chia khối
Các tiếp cận chia khối dung ho hai phơng pháp trên. Zhang v cộng
sự [30] đề xuất so sánh giữa các vùng (khối) tơng ứng trong các khung
liền kề. Các khối đợc so sánh dựa trên các đặc tính thống kê bậc hai của
giá trị cờng độ của chúng, sử dụng tỷ số lân cận [40]. Nagasaka v
một chuyển lia từ từ. Hình 2.7b l một chuyển lia từ từ đợc đánh dấu bắt
đầu tại khung
s
f v kết thúc tại khung
e
f .
- 10 - * Các phơng pháp dựa trên đặc trng cạnh
Phơng pháp của Lienhart [41], Yu [29] mở rộng phơng pháp dùng tỷ
số biến đổi cạnh đã sử dụng phát hiện cắt lia [29] để phát hiện các chuyển
lia dạng mờ dần (fade) v chồng mờ (dissolve). Có một hớng khác l phát
hiện các chuyển đổi từ từ thông qua phân tích các lát cắt thời gian [24].
* Các phơng pháp dựa trên đờng cong sai lệch
Phơng pháp của Alattar [15] phân tích sự biến đổi theo thời gian của
sai lệch cờng độ sáng pixel trong mỗi khung, sau đó nhiều tác giả khác
cải tiến. Do đờng cong biến đổi của một chuyển lia dạng chồng mờ lý
tởng có dạng parabôn, cho nên phát hiện các chúng trở thnh vấn đề phát
hiện mẫu đờng cong ny trong một khoảng thời gian no đó.
2.3.3. Các kỹ thuật phát hiện chuyển lia thực hiện trên video dạng nén
Một số kỹ thuật phân đoạn trực tiếp trên video nén hoặc trên chuỗi video
đã đợc giải nén một phần. L. Yeo v B. Liu [36] đề xuất phân tích các
chuỗi DC để phân đoạn video nén MPEG, sử dụng để phát hiện cả hai dạng
chuyển lia từ từ v đột ngột. N. V. Pathel v cộng sự [37] đề xuất một kỹ
thuật phân đoạn chỉ sử dụng các khung I, dựa trên số thống kê
2
áp dụng
Phát hiện cắt lia nhờ xác định mức độ khác nhau VNC hai khung liền
kề. Phơng pháp ny hiệu quả trên các phơng diện sau: (i) số lợng phép
so sánh giảm; (ii) giảm đợc sai sót nhờ biện pháp lọc nhiễu (3.1.3), không
nhạy với chuyển động của camera v đối tợng.
Hình 3.2. Vùng nền chuyển đổi
Kéo thẳng VNC chuyển thnh vùng nền chuyển đổi (VNCĐ) nh hình
3.2, để thuận tiện cho so sánh các vùng nền.
Vận dụng phơng pháp Tháp Gauss để chuyển một VNCĐ hai chiều
thnh một dãy các pixel (kí hiệu l dayPixel) v cuối cùng sẽ chuyển thnh
một pixel đơn (kí hiệu l dPixel). Kỹ thuật ny đợc minh họa nh trong
hình 3.3. Theo hình vẽ, một VNCĐ (13 x 5) pixel sẽ giảm theo nhiều bớc
để thnh dayPixel v sau đó thnh dPixel. Các tham số dayPixel v dPixel
đợc sử dụng trong các giai đoạn kiểm tra cho những trờng hợp cần cân
nhắc trong thuật toán. Kích thớc của VNCĐ đợc tính nh sau đây.
Giả sử kích thớc của khung l r v c; của VNCĐ l w v L; của VĐT l
h v b (trên hình 3.1). Trớc hết ớc lợng các tham số n
y l
w
,
L
v
h
,
b
. Chọn
- 12 - trên, sẽ giảm đợc 5 pixel xuống 1; 13 pixel xuống 5; 29 pixel xuống 13
Nói chung, phần tử thứ j (
j
s
) trong tập ny đợc tính theo:
,3,2,1;21
2
=+=
=
js
j
i
i
j
(3.1)
Bảng 3.1. Ví dụ minh họa
Giá trị thích hợp cho w l trong tập ny m gần nhất với
w
. Xác định số
gần nhất: Trớc hết tính
)6/)3((log2
2
+Hình 3.6. Lựa chọn các vùng
góc nền của khung video
Thuật toán đợc bổ sung giai đoạn 4, dùng các giá trị dPixelTrai v
dPixelPhai để lọc nhiễu, sau khi thực hiện xong giai đoạn 3 v phát hiện
hai khung i v j có khả năng l một ranh lia.
Đặt KhacTrai (KhacPhai) l các sự khác nhau của hai giá trị dPixelTrai
(dPixelPhai) giữa hai khung i v j.
(%)
2
*100
N
ji
dPixelTraidPixelTrai
KhacTrai
=
(3.4)
Trong đó N l số bit mu (ví dụ chọn N=8). Tơng tự tính đợc
KhacPhai. Từ đó xác định đợc giá trị khác nhau nhỏ nhất KhacGoc:
(
)
KhacPhaiKhacTraiKhacGoc ,min
=
(3.5)
Nếu KhacGoc lớn hơn 10% giá trị khác nhau của các dPixel có thể có
1n
f đợc chia thnh một lới đều các khối. Đo sự giống
nhau giữa mỗi cặp khung nhờ so sánh đặc tính cạnh trong mỗi khối dựa
vo tính tơng quan của một hm khớp. Tiếp theo, ớc lợng chuyển động
cho mỗi khối để bù chuyển động của camera v đối tợng [4]. Nh vậy sự
khác nhau nội dung hình ảnh của cặp khung chỉ còn l kết quả của cắt lia.
- 15 - Luận án trình by chi tiết các bớc: (i) đánh giá chuyển động dựa trên
chia khối; (ii) xác định véc tơ dịch chuyển dựa trên hm tơng quan mức
xám; (iii) mở rộng thuật toán sử dụng các đặc trng cạnh.
Hình 3.9 cho thấy đầu ra điển hình của tơng quan tiêu chuẩn hoá giữa
hai khối trong các khung liền kề về thời gian. Hình 3.10 minh hoạ thuật
toán để đo sự giống nhau cho mỗi khối giữa hai khung. Phép đo giống
nhau
n
E cho mỗi cặp khung
1n
f v
n
f có đợc bằng cách kết hợp số đo
khớp cố định của tất cả các khối.
Hình 3.9. Hm tơng quan cho
số đo sự giống nhau về nội dung
- 16 - 3.2.3. Kỹ thuật bù chuyển động trong phát hiện các chuyển lia từ từ
Phát hiện các chuyển lia từ từ bằng cách đo sự khác nhau giữa nội dung
hình ảnh các khung ở cách xa nhau về mặt thời gian v sẽ sử dụng phơng
pháp đo nh trong phát hiện cắt lia. Chỉ những nội dung ở khung trớc vẫn
xuất hiện ở khung hiện tại mới đợc so sánh. Ba bớc để phát hiện các
chuyển lia mờ dần (fade).
- Phát hiện các khung với biến đổi bằng 0 để đánh dấu điểm bắt đầu của
một rõ dần (fade-in) hoặc điểm kết thúc của một mờ dần (fade-out).
- Sử dụng phơng pháp phát hiện cắt lia để phân biệt giữa chuyển lia mờ
dần v cắt lia tới hoặc từ các ảnh thuần một mu.
- Nếu khẳng định l một chuyển lia mờ dần, xác định rõ điểm bắt đầu
của một mờ dần (fade-out) hoặc điểm kết thúc của một rõ dần (fade-in).
3.2.4. Phát hiện các chuyển lia dạng mờ dần
Kết thúc một mờ dần v bắt đầu một rõ dần đợc đánh dấu bởi một ảnh
thuần một mu. Tuy nhiên, có thể tồn tại các cắt lia tới hoặc từ một ảnh
thuần một mu.
Để xác định nếu
n
f đánh dấu kết thúc của một mờ dần hoặc nếu cặp
khung chứa một cắt lia, cần tính các số đo
n
E v
n
C . Các đặc tính cạnh
n
E
sẽ ít giống nhau. Tuy nhiên, nếu
sát biến đổi của cờng độ pixel theo thời gian nh một mẫu parabôn. Điều
ny phản ánh bởi tỷ lệ lệch chuẩn của cờng độ pixel
n
so với đờng
thẳng xấp xỉ nh thấy trên hình 3.14 - minh hoạ
n
trong một rõ dần.
Trờng hợp một chuyển lia mờ dần tới hoặc từ một cảnh có độ tơng
phản thấp thì chỉ sử dụng độ lệch chuẩn sẽ không thể phát hiện ranh giới
một cách chính xác nh trên hình 3.15.
Cần kết hợp tuyến tính cả hai số đo
n
v giá trị trung bình
n
nh dã
trình by chi tiết trong luận án.
Hình 3.14. Tỷ lệ lệch chuẩn
cờng độ pixel theo thời gian
trong một chuyển lia mờ dần
so với đờng thẳng xấp xỉ
Hình 3.16. Minh họa phơng pháp so sánh không tuyến tính
Chuỗi video ny gồm 50 khung v có 3 lia. Ranh giới giữa lia 1 v lia 2
l các khung
17
k v
18
k , chuyển lia ny l một chuyển lia dạng chồng mờ;
ranh giới giữa lia 2 v lia 3 l các khung
31
k v
32
k , chuyển lia ny l một
cắt lia. Các kỹ thuật phân đoạn trớc đây so sánh giữa các khung liền kề,
quét lần lợt ton bộ các khung nh trên hình 3.16b.
- Kỹ thuật nhảy đều: Không so sánh các khung liền kề m so sánh cách đều
một số khung (bớc nhảy d). Ví dụ d=2 nh trên hình 3.16c. Khi phát hiện
ra 2 khung
i
k v
di
k
+
nằm trong 2 lia khác nhau, sẽ so sánh tuyến tính để
xác định ranh giới lia.
- Kỹ thuật nhảy động: Bớc nhảy d nói trên phụ thuộc vo từng dòng video.
Trong kỹ thuật nhảy động, d đợc xác định động, biến đổi thích ứng để
đảm bảo tối u. Mỗi lần lặp, sẽ tính lại bớc nhảy d cho thích hợp, bằng
cách so sánh khung hiện tại với khung vừa đợc kiểm tra nh trên hình
3.16d. Nếu sự giống nhau của phép so sánh ny nhiều hơn phép so sánh
trớc thì ở phép so sánh kế tiếp, d sẽ đợc tăng lên v ngợc lại. Nếu phát
. Với
kỹ thuật nhảy động, xác định
Stu
N
phức tạp hơn. Trớc hết, so sánh giữa các
khung
1
k
v
3
k
(d=2). Vì chúng nằm trong cùng một lia, nên tiếp tục so
sánh giữa các khung
3
k
v
6
k
(d=3) v sau đó so sánh giữa các khung
6
k
v
10
k
(d=4) cứ tiếp tục cho đến khi so sánh giữa các khung
15
k
v
21
k
một số thuật toán điển hình hiện hnh, thông qua hai tiêu chí chính: (i) độ
chính xác v (ii) tốc độ tính toán. Độ chính xác của một thuật toán thể hiện
ở các tham số: Số lia phát hiện đúng, số lia phát hiện nhầm, số lia bỏ sót.
Tốc độ tính toán thể hiện qua thời gian cần để thực hiện phân đoạn video
trên một đối tợng dữ liệu (file video). Đánh giá, so sánh các thuật toán khi
chúng cùng thực hiện trên một hệ thống v với cùng một đối tợng dữ liệu.
4.1.2. Phơng pháp thực nghiệm
Phơng pháp lựa chọn ngỡng
- 20 - Do chỉ giới hạn ở mục đích chính của thực nghiệm v do trong thực tế
các giá trị ngỡng phụ thuộc vo từng video, cho nên phơng pháp chọn
ngỡng sử dụng l thủ công v đây l sự lựa chọn hợp lý.
Đánh giá kết quả thực nghiệm
Kết quả phân đoạn dữ liệu video đợc đánh giá thông qua các tiêu chí:
- Số lần thực hiện phân đoạn trên các file video, số loại file video;
- Số lia video phát hiện chính xác, phát hiện nhầm, bỏ sót;
- Thời gian thực hiện của các thuật toán.
4.2. Phần mềm PhanDoanVideo06
4.2.1. Chức năng, nhiệm vụ của phần mềm
Phần mềm PhanDoanVideo06 đợc xây dựng dựa trên các thuật toán
phân đoạn m luận án đã đề xuất. Nó thu nhận dòng video từ các đầu vo
camera, card TV v lu lại dới dạng các file AVI. Khi thể hiện lại các file
AVI, phần mềm sẽ tự động phát hiện ranh giới lia.
Phần mềm phân đoạn v so sánh kết quả theo các phơng pháp:
- Dựa trên thuật toán quét tuyến tính;
- Dựa trên thuật toán đánh dấu vùng nền VNC;
- Kết hợp chia khối trên vùng nền dạng hình (VNC);
Tuỳ theo kích thớc khung m chia lới (chia khối) trên khung hình v
tính trung bình mu cho từng ô lới (khối) (hình 4.5). Thuật toán (hình 4.6)
đã đợc mô tả chi tiết trong luận án.
Phần mềm kết hợp phơng pháp chia khối với đánh dấu vùng nền của
khung video dạng hình (VNC), nh trên hình 4.7.
Hình 4.5. Chia lới các khối
cho ton bộ khung hình Hình 4.7. Chia lới cho
VNC của khung hình
Hình 4.6. Lu đồ thuật toán phát hiện
ranh giới lia quét tuyến tính
- 22 - 4.3.2. Thuật toán phát hiện ranh giới lia quét không tuyến tính
Thuật toán đã đợc trình by chi tiết trong luận án.
4.4. Một số kết quả chơng trình
Các kết quả sau đợc thực hiện trên file video dạng AVI, không nén,
kích thớc khung hình (160ì120) pixel, 24 bit mu. Ví dụ file
HaNoi29_thu.avi thực tế có 14 lia với 1301 khung, 13 chuyển lia (cắt lia).
Sử dụng thuật toán tuyến tính, phát hiện đúng 11 cắt lia (hình 4.9) v đã
bỏ sót mất 2 cắt lia: giữa các khung
598
k v
599
Hình 4.10. Hai cắt lia bỏ sót
khi phân đoạn dùng thuật toán
tuyến tính
Hình 4.11. Hai cắt lia phát hiện
nhầm khi phân đoạn dùng
đánh dấu VNC