BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN KHOA HỌC & CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
PHẠM VIỆT BÌNH
PHÁT TRIỂN KỸ THUẬT DÒ BIÊN, PHÁT HIỆN
BIÊN VÀ ỨNG DỤNG
Chuyên ngành : BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNH
& HỆ THỐNG TÍNH TOÁN
Mã số : 62.46.35.01 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC
các kết quả thực tế rất phong phú và đa dạng.
Xuất phát từ thực tế đó, phương pháp nghiên cứu chính của luận án là tiếp tục
tiế
p thu các kết quả trên và cải tiến chúng nhằm ứng dụng trong nhận dạng đối tượng
ảnh. Với mục tiêu của đề tài được đặt ra như sau:
• Tìm hiểu các kỹ thuật xử lý biên trong xử lý ảnh và đồ họa nhằm kế thừa các
kết quả trên và cải tiến chúng.
• Nghiên cứu các kỹ thuật phát hiện biên trực tiếp và gián tiếp. Dựa trên các
nghiên cứu này đề xuất một s
ố phương pháp phát hiện biên mới cho một số
lớp bài toán.
2
• Đề xuất một số bài toán ứng dụng thực tế có sử dụng các phương pháp trên
và cài đặt.
3. Những đóng góp mới của luận án
Luận án đã đề xuất được:
9 Một cải tiến cho thuật toán dò biên đã được phát triển của các tác giả Viện
Công nghệ thông tin nhằm khắc phục một số ngoại lệ của thuật toán cũ.
9 Hai thuật toán phát hiện biên mới dựa vào trung bình cục bộ và các phép toán
hình thái. Trên cơ sở đưa ra công thức mới về phép toán giãn nở nhằm chứng
minh một cách lý thuyết một loạt tính chấ
t của phép toán hình thái.
Đã đưa ra một số ứng dụng của các kỹ thuật phát hiện biên, cụ thể:
9 Ứng dụng quá trình dò biên để tính toán kích thước chủ đạo của các đối
tượng ảnh trong văn bản thông qua kỹ thuật tính biểu đồ tần xuất kích thước
hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh. Trên cơ sở đó đề xuất thuật
toán phát hiện góc nghiêng văn bả
n.
9 Ứng dụng tính chất của đường biên và vị trí tương hỗ giữa chúng trong việc
cắt chữ Việt in dính.
là một ảnh “tốt hơn” hoặc một kết luận. Hình 1.1. Quá trình xử lý ảnh
Ảnh trong xử lý ảnh có thể xem như ảnh n chiều. Bởi vì, ảnh có thể xem là tập
hợp các điểm ảnh. Trong đó, mỗi điểm ảnh được xem như là đặc trưng cường độ sáng
hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và do
đó nó có thể xem như một hàm n biến P(c1, c2, , cn).
Sơ đồ tổng quát của một hệ thống x
ử lý ảnh: Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
1.1.1. Tiền xử lý
Tiền xử lý là giai đoạn đầu tiên trong xử lý ảnh số. Tuỳ thuộc vào quá trình xử
lý tiếp theo trong giai đoạn này sẽ thực hiện các công đoạn khác nhau như: nâng cấp,
khôi phục ảnh, nắn chỉnh hình học, khử nhiễu v.v
1.1.2. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong
quá trình xử lý ảnh. Trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các
đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm.
1.1.3. Đối sánh, nhận dạng
Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm các mẫu là những
vấn đề quan trọng trong thị giác máy. Khi biết một mẫu nào đó, để nhận dạng hoặc
đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace.
Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các
vùng thì ranh giới giữa các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là
hai bài toán đối ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân
lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được
phân lớp thành các đối tượng, do đó có th
ể phát hiện được biên.
1.2.1.1. Phương pháp phát hiện biên trực tiếp
a) Kỹ thuật phát hiện biên Gradient
Theo định nghĩa gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi
giá trị của điểm ảnh.
b) Kỹ thuật phát hiện biên Laplace
Các phương pháp đánh giá gradient ở trên làm việc khá tốt khi mà độ sáng thay
đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp cho
hiệu quả hơn
đó là phương pháp sử dụng đạo hàm bậc hai Laplace.
1.2.1.2. Phương pháp phát hiện biên gián tiếp
a) Một số khái niệm cơ bản
*Ảnh và điểm ảnh
Ảnh là một mảng số thực 2 chiều (I
ij
) có kích thước (m×n), trong đó mỗi phần tử
I
ij
(i = 1, ,m; j = 1, ,n) biểu thị mức xám của ảnh tại (i,j) tương ứng.
*Các điểm 4 và 8-láng giềng
Giả sử (i,j) là một điểm ảnh, các điểm 4 và 8 láng giềng là:
N4= {(i’,j’) : |i-i’|+|j-j’| = 1}, N8 = {(i’,j’) : max(|i-i’|,|j-j’|) =1}.
b) Chu tuyến của một đối tượng ảnh
Định nghĩa 1
nếu và chỉ nếu ∀i ∃j sao cho:
1. Pi và Qj là 4-láng giềng của nhau.
2. Các điểm Pi là vùng thì Qj là nền và ngược lại.
Định nghĩa 3: [Chu tuyến ngoài]
Chu tuyến C được gọi là chu tuyến ngoài nếu và chỉ nếu:
1. Chu tuyến đối ngẫu C
⊥
là chu tuyến của các điểm nền
2. Độ dài của C nhỏ hơn độ dài C
⊥
Định nghĩa 4:
[Chu tuyến trong]
Chu tuyến C được gọi là chu tuyến trong nếu và chỉ nếu:
1. Chu tuyến đối ngẫu C
⊥
là chu tuyến của các điểm nền
2. Độ dài của C lớn hơn độ dài C
⊥
c) Thuật toán dò biên tổng quát
Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau:
• Xác định điểm biên xuất phát
• Dự báo và xác định điểm biên tiếp theo
• Lặp bước 2 cho đến khi gặp điểm xuất phát
Thuật toán dò biên tổng quát
Bước 1: Xác định cặp nền-vùng xuất phát
Bước 2: Xác định cặp nền-vùng tiếp theo
Bước 3: Lựa chọn điể
m biên
cách tiếp cận mới cho việc phát hiện biên dựa vào hình thái và dựa vào trung bình
cục bộ. Cách tiếp cận này mang cả khuynh hướ
ng trực tiếp và gián tiếp.
2.1. THUẬT TOÁN DÒ BIÊN CẢI TIẾN VỚI 4 CẶP NỀN VÙNG
XUẤT PHÁT
Mục này đề cập đến việc khắc phục một số ngoại lệ trong thuật toán dò biên,
trên cơ sở đó đề xuất thuật toán dò biên cải tiến.
2.1.1. Đặt vấn đề
Như đã trình bày trong mục 1.2.1.2, thuật toán dò biên tổng quát bao gồm các
bước sau:
Bước 1: Xác định cặp (nền ,vùng) xuất phát
Bước 2: Xác định cặp (nền, vùng ) tiếp theo
Bước 3: Lựa chọn các điểm biên
Bước 4: Nếu gặp lại cặp xuất phát thì dừng nếu không quay lại bước 2.
Việc xác định cặp (nền, vùng) xuất phát được xác định bằng cách duyệt ảnh từ
trên xuống dướ
i, từ trái qua phải, điểm vùng đầu tiên đạt được và điểm trắng trước đó
hoặc bên cạnh sẽ tạo thành cặp nền vùng xuất phát.
7
Thuật toán dò biên nhằm tìm ra các chu tuyến trong và chu tuyến ngoài của đối
tượng ảnh. Trong trường hợp các đối tượng ảnh có các đường mảnh, thuật toán
thường gặp một số ngoại lệ không tìm hết biên trong:
a) Ảnh gốc b) Ảnh biên
Hình 2.1. Ngoại lệ trong thuật toán dò biên sử dụng cặp nền vùng xuất phát
2.1.2. Cải tiến thuật toán dò biên
2.1.2.1. Khắc phục ngoại lệ đối với biên trong
Ngoại lệ thiếu biên trong là do chúng ta đã đánh dấu các điểm trong quá trình dò
biên nhằm tránh việc trùng lặp trong xử lý. Để khắc phục ngoại lệ này, chúng ta vẫn
giữ nguyên thuật toán cũ nhưng trước mỗi lần dò biên cho một điểm thỏa mãn cặp
(nền, vùng) xuất phát – tạm gọi là điểm hiện thời thì chúng ta phải kiểm tra:
o
, P
2
,
P
4
, P
6
là các điểm kề phải, trên, trái, dưới của P, ta sẽ kiểm tra các trường hợp sau :
- Nếu P
4
là điểm nền, thì cặp (nền, vùng) xuất phát sẽ là (P,P
4
).
- Ngược lại nếu P
0
là điểm nền, thì cặp xuất phát sẽ là (P,P
o
).
- Ngược lại nếu P
2
là điểm nền, thì cặp xuất phát sẽ là (P,P
2
).
- Ngược lại nếu P
6
là điểm nền, thì cặp xuất phát sẽ là (P,P
6
).
Ta có thuật toán dò biên cải tiến bao gồm các bước cơ bản sau:
1
nào đó (P
TB
+ δ
1
< P) thì chúng ta sẽ coi nó là điểm biên và ghi
nhận lại, còn các điểm không thỏa mãn điều kiện trên sẽ được coi là điểm nền.
Hình 2.5. Ma trận điểm ảnh trước và sau lọc
Ảnh biên thu được với δ
1
= 25 Ảnh biên thu được với δ
1
= 250
Hình 2.6. Các ảnh biên kết quả thu được theo thuật toán đề xuất
*Nhận xét:
Thuật toán dò biên sử dụng trong chương trình tuy đã hạn chế được nhiều nhiễu
so với việc sử dụng các bộ lọc và làm nổi rõ các đường biên nhưng vẫn không loại bỏ
được hầu hết các nhiễu. Khi áp dụng thuật toán trên chúng ta vẫn có thể làm giảm bớt
nhiễu đi nhiều hơn nữa bằng cách tăng giá trị của hệ số delta lên. Nhưng khi đó các
đường biên thu được cũng bị
đứt đoạn và mờ đi nhiều.
2.3. PHÁT HIỆN BIÊN DỰA VÀO CÁC PHÉP TOÁN HÌNH THÁI
2.3.1. Các phép toán hình thái và tính chất
2.3.1.1. Các phép toán hình thái cơ bản
Các phép toán này được định nghĩa như sau: Giả thiết ta có đối tượng X và phần
tử cấu trúc (mẫu) B trong không gian Euclide hai chiều. Kí hiệu B
x
⊆ X}
Ví dụ: Ta có tập X như sau: X =
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
00
000
000
00
00
xxx
xx
xx
xxx
xxx
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
000
00000
0000
0000
0000
xx
x
x
x
Định nghĩa 2.3: (OPEN)
Phép toán mở (OPEN) của X theo cấu trúc B là tập hợp các điểm của ảnh X sau
khi đã co và giãn nở liên liếp theo B.
OPEN(X,B) = (X \ B) ⊕ B
Ví dụ: Với tập X và B trong ví dụ trên ta có
OPEN(X,B) =
(X\B) ⊕ B =
⎟
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
0xxx0
0xxx0
00xx0
xxxxx
xxxx0
B =
8
x
11
2.3.1.2. Một số tính chất của phép toán hình thái
(ii) (X
\ B) \ B' = X \ (B ⊕ B')
* Định lý 2.1
Giả sử, X là một đối tượng ảnh, B là mẫu. Khi đó, X sẽ bị chặn trên bởi tập
CLOSE của X theo B và bị chặn dưới bởi tập CLOSE của X theo B.
Ta có, (X
⊕ B) \ B ⊇ X ⊇ (X \ B) ⊕ B
Chứng minh:
Ta có: ∀ x ∈ X ⇒ B
x
⊆
X ⊕ B (Vì X ⊕ B =
U
Xx
x
B
∈
)
⇒ x ∈ (X ⊕ B) \ B (theo định nghĩa phép co)
⇒ (X ⊕ B) \ B ⊇ X (1)
Mặt khác,
∀ y ∈ (X \ B) ⊕ B, suy ra:
∃ x ∈ X \ B sao cho y ∈ B
x
(Vì (X\B) ⊕ B =
U
BΘ∈Xx
x
B )
Theo định lý 2.1 ta có, (X
⊕B)\B ⊇ X ∀B
Như vậy, có thể xem CLOSE(X,B) như là xấp xỉ trên của tập X theo mẫu B
Hình 2.7. Xấp xỉ trên và dưới theo mẫu B của X
Cũng theo định lý 2.1 ta có, (X\B)⊕B ⊆ X ∀B
Do vậy, tập
OPEN(X,B) = (X\B)⊕B có thể được xem như là xấp xỉ dưới của
tập X theo mẫu B.
Từ đó, tập CLOSE(X,B)\ OPEN(X,B) có thể được xem như là xấp xỉ biên của
tập X theo mẫu và quá trình xấp xỉ biên của X theo mẫu B kí hiệu là X
© B.
Để tăng độ chính xác, người ta thường xem B là dãy các phần tử cấu trúc.
{B} = {B
i
, 1≤ i ≤ n }
Và xấp xỉ biên của X theo tập cấu trúc B được xác định:
X©B
Thuật toán phát hiện biên dựa vào phép toán hình thái:
Vào
: Ảnh X và dãy mẫu B= {B
i
, 1≤ i ≤ n };
Ra : Biên của đối tượng theo mẫu B
Phương pháp:
Bước 1: Tính X © B
i
∀i=1,n
©
13
2.3.3. Thực nghiệm
Chúng tôi đã cài đặt thuật toán đề xuất đối với các mẫu tách biên B
i
là:
Trong hình 2.5a dưới đây là ảnh gốc với 256 mức xám, Hình 2.5b là ảnh biên
thu được qua phát hiện biên bằng Sobel, Hình 2.5c là ảnh biên thu được qua Laplace.
Hình 2.5d là ảnh biên kết quả thực hiện bởi thuật toán phát hiện biên bằng các phép
toán hình thái trên với ngưỡng tách
θ = 128
a) Ảnh gốc đa cấp xám b)Ảnh biên thu được qua Sobel
c)Ảnh biên thu được qua Laplace d) Ảnh kết quả dựa vào phép toán hình thái
Hình 2. 8. Phát hiện biên bởi thuật toán dựa vào phép toán hình thái
2.4. KẾT LUẬN VÀ VẤN ĐỀ NGHIÊN CỨU
Chương này tập trung nghiên cứu cải tiến phương pháp dò biên đã có và đề xuất
một số cách tiếp cận phát hiện biên mới dựa vào trung bình cục bộ và đề xuất một
phương pháp phát hiện biên mới dựa vào phép toán hình thái:
• Đề xuất một cải tiến cho thuật toán dò biên trên cơ sở nghiên cứu các ngoại lệ và
tìm cách khắc phục. Thuật toán đề xuất thay thế cặp điểm nền vùng xuất phát bởi 4
cặp nền vùng xuất phát từ đó khắc phục được nhược điểm của thuật toán gốc là bỏ
sót các đường biên trong với trường hợp đối tượng có nhiều đường biên.
• Đề xuất một thuật toán phát hiện biên dựa vào trung bình cục bộ có cả tính chất của
8 × ×
B
2
=
8×
14
Chương 3: Ứng dụng
3.1. TÌM XƯƠNG DỰA TRÊN LÀM MẢNH
Thực chất của quá trình làm mảnh là việc xoá dần các biên theo một thứ tự và
một điều kiện xoá nào đó để thu được xương của đối tượng. Thuật toán làm mảnh tổng quát bao gồm các bước cơ bản sau:
Bước 1: Dò biên theo thuật toán dò biên cải tiến trên.
Bước 2: Với mỗi đường biên. Kiểm tra điểm biên nếu thỏa mãn điều kiện xoá
thì xóa đi.
Bước 3: Nếu không còn điểm biên nào được đánh dấu xoá thì dừng, ngược lại
thì quay lại bước 1.
Hình 3.3: Điểm đảm bảo liên thông
Thuật toán gặp phải một ngoại lệ đó là khi độ dầy của đối tượng là 2 trên một
đường biên. Khi đó, điều kiện liên thông bị phá vỡ, 2 điểm biên sẽ bị xoá, làm cho
đối tượng không còn liên thông nữa. Để giải quyết ngoại lệ này cần kiểm tra khi nào
đối tượng có độ dầy 2 thì xoá luôn điểm đang xét. a) Độ dầy 2 phải-trái b) Độ dầy 2 trên-dưới
Hình 3.4: Độ đầy 2 của đối tượng
b) Điều kiện đảm bảo xương có dạng mảnh
Một điểm biên được gọi là điểm xương dạng mảnh nếu thoả mãn:
• Điểm cuối góc là điểm cuối và chỉ có 1 láng giềng 8.
• Điểm cô lập là điểm không có láng giềng nào.
;
• Điểm cuối của đường thẳng là điểm cuối và chỉ có 1 láng giềng 4.
• Điểm liên kết là điểm mà khi ta bỏ nó đi thì mất tính liên thông.
Áp dụng tiêu chuẩn này kết hợp với thuật toán tìm xương dựa trên làm mảnh
theo điều kiện xoá của các thuật toán đã biết để thu được xương có dạng mảnh mà
16
vẫn đảm bảo tính liên thông. Kết quả thực nghiệm cho thấy chất lượng làm mảnh tốt,
đặc biệt là không bỏ đi những đối tượng có kính thước đều, thông thường sẽ bị làm
mảnh thành một điểm và bị xóa đi.
a) Ảnh gốc
Hough[
ϕ
][r
1
] = 3
x
0
x.cos
ϕ
+y.sin
ϕ
= r
2
Hough[
ϕ
][r
1
] = 4
Hình 3.6: Các hình chữ nhật ngoại tiếp đối tượng ảnh
Ở đây, ta dùng thuật toán dò biên đã được cải tiến trong chương 2 để xác định
biên cho các đối tượng trong ảnh văn bản. Hình chữ nhật ngoại tiếp đối tượng sẽ
được xác định ngay sau khi dò được biên cho đối tượng đó.
Dùng biến đổi Hough áp dụng lên đáy của các hình chữ nhật ngoại tiếp các đối
tượng này và ước lượng góc nghiêng cho văn bản sau khi đã loại bớt đi một số
ϕ
y
0
H
x
x.cos
ϕ
+
y
.sin
ϕ
=r
r
Hình 3.7:
Ví dụ về một ảnh văn bản
nghiêng với nhiều loại đối
tượng
18
a) Xử lý ngoại lệ
Sau giai đoạn tiền xử lý ảnh ta thu được ảnh trung gian TempImage. Thuật toán
phát hiện góc nghiêng sẽ làm việc với ảnh trung gian này để tìm ra góc nghiêng cho
văn bản và sau đó dùng thuật toán quay ảnh để quay ảnh ban đầu với góc nghiêng
vừa tìm được.
Ảnh có quá ít ký tự
3.3. MỘT THUẬT TOÁN CẮT CHỮ IN DÍNH Ở MỨC TỪ DỰA VÀO
CHU TUYẾN
3.3.1. Đặt vấn đề
Điểm mấu chốt của vấn đề nhận dạng chữ in nói chung và chữ Việt in nói riêng
là phải cô lập được chúng. Việc cô lập các chữ được tiến hành sau khi tiến hành phân
tích trang để tách các khối, từ các khối tách ra các dòng, từ các dòng tách ra các từ và
các từ tách ra các ký tự.
Hình trên là một số ví dụ về kí tự chữ Việt in bị dính và bị chèn mà phần mềm
VnDOCR
(*)
phiên bản 2.0 sử dụng phép cắt theo VPP nên phép cắt không chính xác.
Nguyên do, vì đối với những chữ chất lượng xấu như thế này, những chỗ dính có diện
tích tiếp xúc còn lớn hơn cả diện tích tiếp xúc của các phần của một chữ.
Xuất phát từ hoàn cảnh đó trong mục này trình bày một kỹ thuật cắt chữ Việt in
dính nhờ việc sử dụng các tính chất của chu tuyến và vị trí tương h
ỗ giữa chúng với
đối tượng trực tiếp là các chữ in dính mà phần mềm VnDOCR2.0 sau khi sử dụng
phương pháp cắt chữ VPP không cắt được.
3.3.2. Một số khái niệm cơ bản
Cặp điểm thắt:
Là cặp điểm nằm trên chu tuyến ngoài của một từ hay một cụm
chữ dính mà khoảng cách giữa chúng nhỏ hơn nhiều so với khoảng cách dọc theo chu
3.3.3. Thuật toán cắt chữ in dính dựa vào chu tuyến
3.3.3.1. Phân tích bài toán
Ý tưởng chính về việc cắt chữ in dính là “gần nhà, xa ngõ”, dựa vào các đặc
điểm của các cặp điểm thắt để ra quyết định cắt.
Với mỗi một từ hay một cụm chữ dính, trước tiên ta tiến hành tách ra các chu
tuyến, sau đó dựa vào chu tuyến ngoài, để tìm ra các cặp điểm thắt. Trong các nghiên
cứu trước các tác giả đã chỉ ra rằng mỗi đối tượng ảnh, ở đây là một từ hay một cụm
chữ dính, t
ồn tại duy nhất một chu tuyến ngoài. Chữ trước khi dò biên
Chữ sau khi dò biên
Chu tuyến trong
Chu tuyến ngoài
Quá trình tìm cặp điểm thắt
Điểm đang xét
Điểm phân nửa trên và nửa dưới
chu tuyến ngoài
Hình 3. 15. Quá trình tìm chu tuyến và cặp điểm xét duyệt a) Cụm chữ dính b) Các cặp điểm thắt tìm được c) Các cặp điểm cắt sau khi tính tới vị trí
tương hỗ của chu tuyến trong
Hình 3.16. Thực hiện cắt chữ in dính có tính đến vị trí tương hỗ của chu tuyến trong
Hình 3.14: Ví dụ về đường cắt và mật độ cắt
thời tiết ). Vì vậy, với kỹ thuật trừ khung hình liề
n kề có thể làm cho quá trình bám
đối tượng chuyển động bị mất đi (vì có thể có 2 khung hình có độ khác nhau không
đáng kể). Với kỹ thuật trừ khung hình liền kề chúng ta có được nhận xét sau:
• Chưa tối ưu được quá trình xử lý, vì phải xử lý tất cả khung hình có trong
đoạn video mặc dù chúng không có sự thay đổi (các đối tượng không chuyển
động).
• Thu được những thay đổi nhỏ đối với những đối tượng có chuyển động chậm
và có thể là không phân biệt được vì thay đổi ít, vì vậy mà khó có thể lấy
được toàn bộ đối tượng chuyển động.
• Chứa nhiều nhiễu, do thời tiết, độ tương phản, độ bóng làm thay đổi giá trị
màu ở những vùng không chuyển động.
Vì vậy, chúng ta sẽ không thực hiện trừ khung hình liền kề để phát hiện đối
tượng. Dưới đây chúng ta sẽ xem xét một hướng tiếp cận kết hợp: kỹ thuật trừ khung
hình, đo độ thay đổi, xét vị trí và kỹ thuật dò biên ảnh đa cấp xám để nâng cao hi
ệu
quả phát hiện đối tượng chuyển động.
3.4.2. Phát hiện đối tượng chuyển động theo hướng tiếp cận kết hợp
Đây cũng là một hướng tiếp cận dựa trên kỹ thuật trừ ảnh, độ đo tương tự, xét vị
trí tương đối giữa các vùng thay đổi giá trị màu ở các khung hình, phát hiện biên ảnh
đa cấp xám.
22
Dưới đây là bước thực hiện của thuật toán phát hiện đối tượng chuyển động theo
hướng tiếp cận kết hợp.
Bước 1 : Trừ ảnh và đánh dấu Iwb
Bước 2 : Lọc nhiễu trên ảnh Iwb, phát hiện độ dịch chuyển
Bước 3 : Phát hiện biên Igc
Bước 4 : Kết hợp Igc với Iwb
3.4.2.1. Trừ ảnh và đánh dấu Iwb
Đây là bước phát hiện vùng khác biệt dựa trên kỹ thuật trừ điểm ảnh, giá trị
ễ
a) I
p
b) I
c
Hình 3.20: a), b) là 2 khung hình có độ sai khác thỏa mãn ngưỡng,
c) Ảnh Iwb chưa lọc nhiễu, d) là ảnh Iwb sau khi lọc nhiễu
a) I
c
b) Ig
c
c) Ie
cHình 3.21: a) Ảnh gốc, b) Ảnh cấp
xám, c) Ảnh biên
23
3.4.2.4. Kết hợp ảnh Igc với Iwb
Ảnh sau khi đã được phát hiện biên Iec được xếp chồng với ảnh đen trắng Iwb.
Vùng đen trắng kết hợp với điểm biên sẽ cho ta được tập hợp các điểm bao quanh
vùng chuyển động. Những điểm biên của Iec gần với vùng trắng của Iwb được đánh
dấu lại trên Igc.
Những điểm được lưu lại sẽ được xử lý để lấ
y được hình bao quanh đối tượng
chuyển động đó. Và quá trình phát hiện được vùng biên của đối tượng chuyển động
kết thúc.
3.3.3. Thử nghiệm
Trong phần này, trình bày một số hình ảnh kết quả đạt theo hướng tiếp cận kết
hợp. Đoạn băng video có dạng avi, được quay tại ngã ba Bắc Nam thành phố Thái
Phần kết luận
Luận án gồm 108 trang được viết dựa trên 9 bài báo đã tập trung nghiên cứu một
số phương pháp phát hiện biên, các kỹ thuật để nâng cao chất lượng biểu diễn biên và
ứng dụng của biên trong xử lý ảnh với các kết quả đạt được như sau:
1. Đề xuất một cải tiến cho thuật toán dò biên trên cơ sở nghiên cứu các ngoại lệ và
tìm cách khắc phục. Dựa vào cải tiến này, luận án đã trình một đề xuất xử lý các
thuật toán làm mảnh dựa vào biên.
2. Đưa ra một mối liên hệ mới của phép toán giãn nở trên cơ sở đó chứng minh một
cách chặt chẽ về mặt toán học cho các tính chất của các phép toán hình thái. Các
phép toán có nhiều ứng dụng trong nhận dạng và xử lý ảnh. Trên cơ sở đó đề xuất
một thuật toán phát hiện biên mới dựa vào các phép toán hình thái.
3. Đề xuất một thuật toán phát hiện biên dựa vào trung bình cục bộ. Thuật toán vừa
có tính chất của thuật toán phát hiện biên gián tiếp lại vừa có tính chất của phát
hiện biên trực tiếp. Do đó, về mặt nào đó đã phát huy được cả 2 ưu điểm của các
phương pháp phát hiện biên truyền thống.
4. Đề xuất thuật toán phát hiện góc nghiêng văn bản một cách thông minh thông qua
việc tính toán kích thước chủ đạo của các đối tượng ảnh trong văn bản thông qua
kỹ thuật tính biểu đồ tần xuất kích thước hình chữ nhật nhỏ nhất bao quanh đối
tượng ảnh được xác định trong quá trình dò biên.
5. Đề xuất một thuật toán cắt chữ Việt in dính nhờ việc sử dụng tính chất của đường
biên và vị trí tương hỗ giữa chúng. Việc sử dụng tính chất của chu tuyến, vị trí
tương hỗ giữa chúng và một số tính chất khác liên quan trong việc cắt chữ dính tỏ
ra khá hiệu quả hơn đối với lớp các chữ Việt in dính đã được áp dụng các phương
pháp truyền thố
ng.
6. Đưa ra hướng tiếp cận kết hợp dựa trên kỹ thuật trừ ảnh và kỹ thuật phát hiện biên
để giải quyết bài toán phát hiện đối tượng chuyển động.