1
LỜI CẢM ƠN
Trước hết em xin được bày tỏ lòng biết ơn sâu sắc đối với thầy giáo hướng
dẫn PGS.TS. Ngô Quốc Tạo, Viện Công Nghệ Thông Tin -Viện Khoa Học & Công
Nghệ Việt Nam đã tận tình giúp đỡ, chỉ bảo em trong thời gian vừa qua và đã dành
rất nhiều thời gian quý báu để giúp em hoàn thành đề tài được giao. Em xin chân
thành cảm ơn thầy PGS, TS. Đỗ Năng Toàn, Viện Công Nghệ Thông Tin – Viện
Khoa Học & Công Nghệ Việt Nam, người đã cho em niềm đam mê về lĩnh vực Xử
lý ảnh.
Em xin gửi lời cảm ơn đến các Thầy cô giáo trong Khoa Công nghệ thông tin,
trường Đại Học Dân Lập Hải Phòng đã giảng dạy chúng em trong suốt quãng thời
gian qua, cung cấp cho chúng em những kiến thức chuyên môn cần thiết và quý báu
giúp chúng em hiểu rõ hơn các lĩnh vực đã nghiên cứu để hoàn thành đề tài được
giao .
Cuối cùng, em xin cảm ơn các bạn bè và gia đình đã động viên cổ vũ, đóng góp
ý kiến cho em trong suốt quá trình học cũng như làm tốt nghiệp, giúp em hoàn
thành đề tài đồ án đúng thời hạn.
Hải Phòng, tháng 7 năm 2010
Sinh viên
Nguyễn Thị Lan
2
2.3.1. Phƣơng pháp tìm biên theo hình chóp ( pyramid edge
detection) ............................................................................................ 22
2.3.2 Phƣơng pháp toán tử tìm biên la bàn Kirsch. ....................... 24
2.4. Kỹ thuật dò biên tổng quát.................................................................. 25
2.4.1. Các khái niệm cơ bản .............................................................. 25
2.4.2. Các kỹ thuật dò biên ............................................................... 26
CHƢƠNG III: PHƢƠNG PHÁP PHÁT HIỆN BIÊN DỰA VÀO ............ 29
PHÉP TOÁN HÌNH THÁI ............................................................................. 29
3.1. Các phép toán hình thái cơ bản .......................................................... 29
3.2. Thuật toán phát hiện biên dựa vào phép toán hình thái .................. 31
3.3. Ứng dụng của các phép toán hình thái trong nhận dạng biên ảnh . 32
CHƢƠNG IV: MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN BIÊN NÂNG
CAO .................................................................................................................. 33
4.1. Phƣơng pháp Canny ............................................................................ 33
3
4.1.1. Cơ sở lý thuyết của thuật toán ............................................... 33
4.1.2 . Mô tả thuật toán ..................................................................... 35
4.2. Phƣơng pháp Shen - Castan ................................................................ 39
4.2.1. Cơ sở lý thuyết của thuật toán ............................................... 39
4.2.2 Hoạt động thuật toán ............................................................... 41
4.3. Phƣơng pháp phát hiện biên Marr- Hildreth.................................... 43
4.3.1. Cơ sở lý thuyết chung .............................................................. 43
4.3.2. Mô tả thuật toán ...................................................................... 44
ỨNG DỤNG CÁC PHƢƠNG PHÁP PHÁT HIỆN BIÊN .......................... 45
CHƢƠNG V: CÀI ĐẶT VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN................ 48
5.1. Các phƣơng pháp cổ điển .................................................................... 48
5.1.1. Thuật toán ................................................................................ 48
5.2. Phƣơng pháp Canny và phƣơng pháp Shen-Castan ........................ 50
5.2.1. So sánh hai thuật toán ............................................................. 50
5
Chƣơng I: Một số khái niệm cơ bản trong Xử lý ảnh. Chương này
trình bày tổng quát về Xử lý ảnh và các khái niệm sẽ dùng trong đồ án này.
Chƣơng II: Các phương pháp phát hiện biên cổ điển. Dùng các toán
tử đạo hàm để tìm biên. Tiếp theo là kỹ thuật dò biên tổng quát.
Chƣơng III: Phương pháp phát hiện biên dựa vào phép toán hình
thái. Hai phép toán hình thái cơ bản là: Dilation và Erosion.
Chƣơng IV: Một số phương pháp phát hiện biên nâng cao. Chương
này đề cập đến 3 phương pháp tìm biên nâng cao đó là phương pháp Canny, Shen-
Castan, Marr-Hildreth. Tiếp theo là ứng dụng của biên.
Chƣơng V: Cài đặt và đánh giá một số thuật toán trong phương pháp
phát hiện biên bằng ngôn ngữ Virtual C++.
Kết luận:
Phụ lục:
Khi bắt tay vào việc nghiên cứu đề tài này, em đã cố gắng hết sức để
hoàn thành công việc được giao, song điều kiện về thời gian và trình độ còn hạn chế
nên em không thể không tránh khỏi được những thiếu sót. Em rất mong được sự
góp ý của thầy giáo hướng dẫn, thầy giáo phản biện cũng như các thầy cô giáo và
bạn bè trong Khoa Công Nghệ Thông Tin, qua đó em đã rút ra được những kinh
nghiệm thực tế và bổ ích để sau này em có thể xây dựng được một chương trình
hoàn chỉnh hơn.
Nhận dạng
7
• Tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh giá các
nội dung của ảnh.
1.1.2. Ảnh và điểm ảnh
Trong quá trình số hóa người ta biến đổi tín hiệu liên tục thành tín hiệu rời
rạc thông qua quá trình lấy mẫu và lượng tử hóa. Do vậy điểm ảnh có thể xem như
sự biểu diễn về cường độ sáng hay một dấu hiệu nào đó của ảnh tại một tọa độ nào
đó. Ảnh còn là tập hợp các điểm ảnh.
1.1.3. Mức xám ( Gray level)
Mức xám là sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với
một giá trị là số và là kết quả của quá trình lượng tử hóa. Cách mã hóa thường dùng
là 16, 32, hay 64 mức. Mã hóa 256 mức là thông dụng nhất do kỹ thuật vì 2
8
=256(
0,1…255) nên với 256 mức thì mọi pixel được mã hóa bởi 8 bit.
1.1.4. Pixel ( Picture element)
Là phần tử ảnh, điểm ảnh. Ảnh trong thực tế là ảnh liên tục về không gian độ
sáng. Để có thể xử lý ảnh bằng máy tính cần phải tiến hành số hóa, người ta biến
đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về
không gian) và lượng hóa thành phần giá trị mà về nguyên tắc bằng mắt thường
không phân biệt được hai điểm kề nhau. Do vậy một điểm ảnh là tập hợp các pixel,
mỗi pixel gồm một cặp tọa độ x, y và màu. Một pixel có thể lưu trữ trên 1, 4, 8 hay
24 bit.
1.1.5. Biểu diễn ảnh
Trong biểu diễn ảnh, người ta dùng các phần tử đặc trưng của ảnh là pixel.
Có thể xem một hàm hai biến chứa các thông tin như biểu diễn của ảnh, việc xử lý
ảnh số yêu cầu ảnh phải được mã hóa và lượng tử hóa. Việc lượng tử hóa ảnh là
chuyển đổi tín hiệu tương tự sang tín hiệu số của một ảnh đã lấy mẫu sang một số
9
1.2. Các định dạng cơ bản trong xử lý ảnh
Trong quá trình xử lý ảnh, một ảnh thu nhận vào máy tính phải được mã hóa.
Hình ảnh khi lưu trữ dưới dạng tệp tin sẽ được số hóa. Một số dạng ảnh đã được
chuẩn hóa như: ảnh GIF, BMP, PCX, IMG, TIFF…
• Ảnh IMG: Là ảnh đen trắng, phần đầu của ảnh có 16 byte chứa các thông
tin cần thiết, ảnh IMG được nén theo từng dòng. Mỗi dòng bao gồm các gói ( pack).
Các dòng giống nhau cũng nén thành một gói.
• Ảnh PCX: Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển
nhất, nó thường được dùng để lưu trữ ảnh, nó sử dụng phương pháp mã loại dài
RLE (Run-Length-Encoded ) để nén dữ liệu ảnh, quá trình nén và giải nén được
thực hiện trên từng dòng ảnh.
• Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được tổ chức thành
các nhóm dòng ( cột) quét của dữ liệu ảnh.
• Ảnh GIF (Graphics Interchanger Format): Với định dạng ảnh GIF những
vướng mắc mà các định dạng khác gặp phải khi số trong ảnh tăng lên không còn
nữa. Dạng ảnh GIF cho chất lượng cao độ phân giải đồ họa cũng đạt cao, cho phép
hiển thị trên hầu hết các phần cứng.
• Ảnh BMP ( Windows Bitmap): Là một định dạng tập tin hình ảnh khá phổ
biến, cấu trúc tập tin ảnh bao gồm 4 phần:
•• Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.
•• Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển thị
ảnh.
•• Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh.
•• Bitmap Data: lưu dữ liệu ảnh.
xác định. Nếu sự thay đổi cấp xám giữa các vùng trong ảnh càng lớn thì đường biên
càng dễ dàng nhận ra. Trong trường hợp này sự thay đổi này lại diễn ra tại một điểm
nên đường biên có độ rộng là một điểm ảnh và vị trí của đường biên chính là vị trí
thay đổi cấp xám.
• Đƣờng biên bậc thang
Đường biên bậc thang xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm
ảnh. Vị trí của đường biên được xem như vị trí chính giữa của đường nối giữa cấp
xám thấp và cấp xám cao. Tuy nhiên đây chỉ là đường thẳng trong toán học, từ khi
ảnh được kỹ thuật số hoá thì đường đó không còn là đường thẳng mà thành những
đường không trơn.
• Đƣờng biên thực ( không trơn)
Đường biên thực xuất hiện khi sự thay đổi cấp xám tại nhiều điểm ảnh nhưng không
trơn.
1.3.3. Các khái niệm về nhiễu
Trong thực tế không bao giờ xảy ra trường hợp không có nhiễu, mà nhiễu
xuất hiện hoàn toàn ngẫu nhiên nên không thể dự đoán nhiễu một cách chính xác.
Tuy nhiên dựa trên những ảnh hưởng của nhiễu gây ra trên ảnh ta có thể mô tả
nhiễu theo độ lệch tiêu chuẩn và giá trị trung bình của nó. Trong phân tích ảnh
chúng ta quan tâm đến hai kiểu nhiễu chính đó là:
a, Nhiễu độc lập tín hiệu ( Nhiễu cộng )
Là một tập ngẫu nhiên các mức xám độc lập với dữ liệu ảnh. Tức là được
cộng thêm vào các điểm ảnh để được ảnh bị nhiễu. Loại nhiễu này thường xuất hiện
khi ảnh được truyền bằng điện tử từ nơi này đến nơi kia. Nếu ảnh A là ảnh không có
nhiễu, N là nhiễu xuất hiện trong quá trình truyền ảnh thì kết quả cho một ảnh A
'
có
nhiễu như sau: A
'
= A+N.
bằng việc xét những lỗi mà một thuật toán tìm biên có thể mắc phải. Một thuật toán
tìm biên có thể mắc phải các lỗi sau:
13
• Lỗi âm: Một thuật toán tìm biên có thể không thông báo một biên trong khi
nó tồn tại
• Lỗi dương: Một thuật toán tìm biên có thể thông báo về một biên trong khi
nó không tồn tại. Điều này có thể do nhiễu hoặc do việc thiết kế thuật toán sơ sài
hoặc do quá trình phân ngưỡng.
• Vị trí của một điểm biên có thể bị nhầm. Trong các ảnh thử nghiệm ta biết
được số lượng và vị trí của các điểm biên, biết được số lượng và kiểu nhiễu nên
việc áp dụng các phương pháp phát hiện biên và các ảnh này sẽ cho ta một sự đánh
giá gần đúng và hiệu quả của các phương pháp phát hiện biên.
Sau đây sẽ giới thiệu hai phương pháp đánh giá đó là: phương pháp Pratt và
phương pháp Kitchen-Rosenfeld
1.4.1. Đánh giá Pratt
Dựa vào những phân tích trên, năm 1978 Pratt đã đề xuất ra hàm :
E1=
)I,max(I
iA
A
I
i
id
1
2
)(1
1
K
a Trường hợp khác.
Trong đó: d : hướng của biên tại điểm đang xét
d
0
: hướng của biên tại điểm láng giềng phải
d
1
: hướng của láng giềng phải trên tương tự ngược chiều kim đồng hồ
với những điểm liên quan
a: là hàm đo độ lệch góc giữa hai góc bất kì
a ( α, β) =
Một hàm tương tự để đo hướng liên tục về phía bên phải của điểm biên đang xét:
Nếu láng giềng K là một điểm biên.
R
K
=
0
2
d ,
4
k
a .d d,
K
a
• Phương pháp tìm biên trực tiếp: là phương pháp làm nổi biên dựa vào sự
biến thiên về giá trị độ sáng của điểm ảnh. Kỹ thuật này chủ yếu dùng phát hiện
biên ở đây là kỹ thuật đạo hàm, nếu lấy đạo hàm bậc nhất của ảnh ta có phương
pháp Gradient, Sobel, Prewitt, nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace. Các
phương pháp này sẽ được mô tả ở dưới.
• Phương pháp tìm biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh
thành các vùng, trong vùng đó những điểm ảnh có tính chất tương tự nhau, khi đó
ranh giới giữa các vùng đó được gọi là biên.
Như vậy: Phương pháp phát hiện biên trực tiếp và gián tiếp là hai bài toán
đối ngược nhau, khi biết các vùng sẽ tìm được biên và ngược lại. Tuy nhiên trong
một số trường hợp không thể làm ngược lại ( Biên hở).
16
Tuy nhiên, phương pháp tìm biên trực tiếp thường sử dụng có hiệu quả đối
với các ảnh ít chịu ảnh hưởng của nhiễu, song nếu như sự biến thiên độ sáng không
đột ngột thì phương pháp này tỏ ra kém hiệu quả. Phương pháp tìm biên gián tiếp
giải quyết tốt trong trường hợp này, tuy nhiên cài đặt tương đối khó khăn. Với các
phương pháp tìm biên trực tiếp, có hai dạng sau:
• Phương pháp tìm biên dùng bộ lọc tuyến tính: Phương pháp này dựa
trên phép toán xử lý lân cận cục bộ hoặc xử lý tổng thể. Xử lý lân cận là sử dụng
các ma trận hệ số lọc kích thước nhỏ, còn xử lý tổng thể là thực hiện trên toàn ảnh
và có thể coi như sử dụng ma trận hệ số lọc có kích thước bằng kích thước của ảnh
cụ thể như các phương pháp Gradient, Sobel, Prewitt, Laplace…
• Phương pháp tìm biên phi tuyến: Phương pháp này không dựa trên phép lọc
tuyến tính mà sử dụng các phép toán phi tuyến như phép toán lựa chọn, so sánh
được áp dụng trong phương pháp hình chóp, Kisrch…
Sau khi đưa ra các khái niệm cơ bản phục vụ cho việc xây dựng một phương
pháp tách cạnh, một câu hỏi được đặt ra làm thế nào để có thể tìm ra được cạnh.
Một cạnh như đã nói ở trên là sự thay đổi cấp xám hay thay đổi chu tuyến màu. Nếu
ta mô tả sự thay đổi trên sơ đồ nêu trên thì sẽ thấy các mức xám có đường cong biến
Tất nhiên ảnh không phải là một hàm, và cũng không thể được vi phân hóa
bằng cách thông thường. Thực chất chúng ta sử dụng sai phân để tính xấp xỉ đạo
hàm vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại. Một sự xấp xỉ đơn giản
nhất là toán tử
1
:
x1
A( x, y) = A( x, y) - A( x-1, y)
y1
A( x, y) = A( x, y) - A( x, y-1)
Giả thiết trong trường hợp này các cấp xám biến đổi giữa các điểm ảnh là
tuyến tính, do đó mà giá trị đạo hàm là độ nghiêng của đường thẳng. Các phương
pháp sử dụng đạo hàm bậc nhất làm việc khá tốt khi mà độ sáng thay đổi rõ nét. Khi
mức xám thay đổi chậm, miền chuyển tiếp trải rộng, phương pháp này hiệu quả hơn
là phương pháp sử dụng đạo hàm bậc hai. Khi đó toán tử
2
xấp xỉ với các đạo
hàm bậc hai: 2
x2
A = A( x +1, y) - A( x-1, y)
2
y2
A = A( x, y +1) - A( x, y-1)
A
y
A Độ lớn của cạnh sẽ là một số thực và thường được làm tròn thành số nguyên.
Điểm ảnh nào mà có gradient vượt quá giá trị ngưỡng cho trước thì nói rằng đó là
điểm cạnh, còn những điểm khác không phải. Hai toán tử tách cạnh được đánh giá ở
đây sẽ sử dụng giá trị trung vị trong khoảng các cấp xám như một ngưỡng. Để tìm
hiểu kỹ về các vấn đề trên em xin lần lượt trình bày các phương pháp tìm biên ở
trong phần sau.
2.2. Phƣơng pháp tìm biên dựa trên kĩ thuật lọc tuyến tính
Kỹ thuật lọc tuyến tính thực chất là quá trình xếp chồng ảnh đầu vào với một
hạt nhân xếp chồng tương ứng. Các hạt nhân xếp chồng này được xây dựng trên cơ
sở hai phép toán cơ bản, đó là phương pháp Gradient và phương pháp Laplace. Về
lý thuyết mỗi phương pháp xác định biên này thường trải qua các giai đoạn chính
sau:
• Loại bỏ nhiễu
• Chọn toán tử thực hiện
19
• Chọn phương pháp xác định điểm biên
• Liên kết các điểm biên
Sau đây các phép toán tìm biên sẽ được trình bày
2.2.1. Phƣơng pháp đạo hàm bậc nhất Gradient
Phương pháp Gradident là phương pháp dò biên cục bộ dựa vào cực đại của
đạo hàm. Theo định nghĩa Gradient là một vector có các thành phần biểu thị tốc độ
dx
x
f
dr
df
..
-f
x
. cos θ + f
y
.
sin θ
d
dy
y
f
d
dx
x
f
d
df
..
-f
x
. r. sin θ + f
y
.r.
20
Tuy ta nói lấy đạo hàm của ảnh, nhưng thực ra chỉ là mô phỏng và xấp xỉ đạo hàm
bằng kĩ thuật nhân chập ( cuộn). Do ảnh số là tín hiệu rời rạc, do vậy đạo hàm
không tồn tại.
Các bước tiến hành như sau:
1. Dùng 2 mặt nạ là: H
1
=
00
11
và H
2
=
01
01
2. Với mỗi điểm ảnh I(x, y) ta tính Gradient I(x, y):
Gradient I(x, y) =
22
2,1, HyxIHyxI
3. Tìm các điểm biên I'(x, y) = Gradient I(x, y)
Nếu Gradient I(x, y) > θ thì I'(x, y) = 1
Gradient I(x, y) <= θ thì I'(x, y) = 0
Việc xấp xỉ đạo hàm bậc nhất theo các hướng x, y được thực hiện thông qua 2 mặt
nạ nhân chập tương ứng sẽ cho ta các kỹ thuật phát hiện biên khác nhau. Phương
pháp này có thể tạo ra một số mặt nạ khác bằng cách sử dụng kỹ thuật lấy đạo hàm
trái, phải, trung tâm.
Kỹ thuật Prewitt:
S1
= I(x,y) S
1
I
S2
= I(x,y) S
2
I
S(x,y)
= |I
S1
| + |I
S2
|
21
2. Tìm các điểm biên I'(x, y) = I
S(x,y)
Nếu I
S(x,y)
> θ thì I'(x, y) = 1
I
S(x,y)
<= θ thì I'(x, y) = 0
2.2.2. Phƣơng pháp đạo hàm bậc 2 Laplace
Các phương pháp lấy đạo hàm bậc 1 ở trên làm việc khá tốt khi mà độ sáng
thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng thì phương
pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo hàm bậc 2 mà trong phần
2
2
y
f
=
y
y
fy
( f ( x, y)- f ( x, y-1 ))
( f ( x, y+1 ) - f ( x, y)) - (f ( x, y)- f ( x, y-1))
= f ( x, y+1 ) - 2f( x, y) + f ( x, y-1)
Do đó:
2
f = f ( x+1, y )+ f ( x, y+1 ) - 4f( x, y) + f ( x- 1, y) + f ( x, y-1)
Toán tử Laplace dùng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời rạc đạo hàm bậc
hai. Dưới đây là các kiểu mặt nạ hay dùng:
L
1
=
121
252
121
L
2
=
111
181
(x, y)<= θ thì I'(x, y) = 0
2.3. Một số phƣơng pháp tìm biên phi tuyến
Các toán tử để tìm biên đã trình bày ở trên là các toán tử tuyến tính tổng
quát. Với một ảnh đầu vào qua toán tử này ta tạo ảnh đầu ra mà mỗi điểm của nó là
tổ hợp tuyến tính của các điểm đầu vào với các hệ số của bộ lọc tương ứng. Như
vậy không có quá trình trung gian, so sánh, sắp xếp, lựa chọn hay các phép tính
phân chia phức tạp khác. Trong phần này sẽ giới thiệu một số kỹ thuật cơ bản theo
phương pháp này.
2.3.1. Phƣơng pháp tìm biên theo hình chóp ( pyramid edge detection)
Thông thường trong một số trường hợp ảnh bao gồm nhiều các đường biên
trong đó có đường biên dài, có đường biên ngắn, có đường biên hoặc không có
đường biên. Vấn đề ở đây cần loại bỏ đi một số đường biên trong ảnh không đáng
quan tâm đối với người sử dụng, đó là các đường biên ngắn, đường biên mờ và
đường biên không được kết nối với nhau, trong khi cần làm nổi được những đường
biên thực sự, đó là những đường biên đậm và dài. Một giải pháp đó là phương pháp
tìm biên theo hình chóp. Phương pháp này được định nghĩa như sau:
• Ảnh gốc được chia làm 4 phần bởi chia đôi độ dài mỗi chiều. Mỗi giá trị
điểm ảnh trong ảnh nhỏ một phần tư mới là trung bình cộng của bốn điểm ảnh
tương ứng trong ảnh gốc theo công thức sau:
23
I
new
(
2
,
2
nm
)=
4
10
Với mỗi biên của B ta lại tìm biên với 4 điểm tương ứng của nó trên ảnh gốc, khi đó
sẽ được biên thực là C:
Biên thực ( C) là:
1101
1111
01
1124
2.3.2 Phƣơng pháp toán tử tìm biên la bàn Kirsch.
Toán tử này được xây dựng trên cơ sở cửa số (3 x 3, 5 x 5, ….)
Trong trường hợp của cửa sổ 3 x 3, nó được mô tả như sau: Mỗi điểm ảnh đầu ra là
giá trị lớn nhất trong 8 kết quả xếp chồng của cửa sổ (a) dưới đây với ma trận ảnh.
Sau mỗi lần xếp chồng ta quay cửa sổ lọc này đi một góc 45
0
và lấy làm cửa sổ xếp
chồng cho lần sau.
Lần 1 dùng cửa sổ xếp chồng sau:
H
1
=
333
303
555
( a )
Lần 2 quay cửa sổ đi một góc 45
0
Ở đây phép toán a, b được định nghĩa là phần dư của phép chia (a+b) cho 8
và F
(j)
là trị số của phần dư thứ j của cửa sổ lọc. Thứ tự các phần tử của cửa sổ lọc
theo chiều kim đồng hồ, riêng phần tử thứ 9 là phần tử trung tâm của cửa sổ.
25
2.4. Kỹ thuật dò biên tổng quát
2.4.1. Các khái niệm cơ bản
• Ảnh và điểm ảnh
Ảnh là một mảng số thực 2 chiều (Iij) có kích thước (m n), trong đó mỗi
phần tử Iij(i = 0,...,m; j = 0,...,n) biểu thị mức xám của ảnh tại (i,j) tương ứng.
Ảnh được gọi là nhị phân nếu các giá trị Iij chỉ nhận giá trị 0 hoặc 1.
Ở đây ta chỉ xét tới ảnh nhị phân vì ảnh bất kỳ có thể đưa về dạng nhị phân
bằng cách phân ngưỡng. Ta ký hiệu là tập các điểm 1 (điểm vùng) và
A
là tập
các điểm 0 (điểm nền).
• Các điểm 4 và 8-láng giềng
Giả sử (i,j) là một điểm ảnh, các điểm 4-láng giềng là các điểm kề trên, dưới,
trái, phải của điểm (i, j) :
N4= {(i’,j’) : |i-i’|+|j-j’| = 1},
Và những điểm 8-láng giềng gồm:
N8 = {(i’,j’) : max(|i-i’|+|j-j’|) =1}.
Trên hình 1 các điểm P0, P2, P4, P6 là các 4-láng giềng của điểm P, còn các
điểm P0, P1, P2, P3, P4, P5, P6, P7 là các 8-láng giềng của P.
P
P0, P2, P4, P6
,
, P0