TIỂU LUẬN MÔN XỬ LÝ ẢNH NÂNG CAO : NGƯỠNG
Vì tính trực quan và đơn giản thực hiện, ngưỡng hình ảnh một vị trí trung tâm trong
các ứng dụng của phân vùng ảnh. Đơn giản ngưỡng lần đầu tiên được giới thiệu trong
phần 3.1, và chúng ta đã sử dụng nó trong các cuộc thảo luận khác nhau trong các
chương trước. Trong phần này, chúng tôi giới thiệu ngưỡng một cách chính thức hơn
và mở rộng nó để kỹ thuật mà là đáng kể tổng quát hơn những gì đã được trình bày
cho đến nay.
10.3.1 Nền tảng
Giả sử rằng biểu đồ màu xám cấp hình. 10.26 (a) tương ứng với một hình ảnh, f (x,
y), bao gồm các đối tượng ánh sáng trên một nền tối, trong một cách mà đối tượng và
nền pixel có mức xám nhóm lại thành hai chế độ chi phối. Một cách rõ ràng để trích
xuất các đối tượng từ nền là để chọn một ngưỡng T phân cách các chế độ này. Sau đó
bất kỳ điểm (x, y) mà f (x, y) > T được gọi là một điểm đối tượng: nếu không, các
điểm được gọi là một điểm nền. Đây là loại ngưỡng giới thiệu trong phần 3.1.
Hình 10.26 (a) biểu đồ màu xám cấp có thể được phân chia bởi (a) một ngưỡng duy
nhất, và (b) nhiều ngưỡng.
Hình 10.26 (b) cho thấy một trường hợp hơi tổng quát hơn của phương pháp này, nơi
ba chế độ thống trị đặc trưng cho biểu đồ hình ảnh (ví dụ, hai loại đối tượng ánh sáng
trên nền tối). Đây, ngưỡng đa phân loại một điểm (x, y) là thuộc về một lớp đối tượng
nếu T1 <(x, y) <T2, cho lớp đối tượng khác nếu f (x, y)> T2, và nền nếu f (x, y) <T3.
Nói chung, vấn đề phân chia nhỏ đòi hỏi nhiều ngưỡng được giải quyết tốt nhất sử
dụng phương pháp phát triển khu vực, chẳng hạn như những thảo luận trong phần
10.4.
Dựa trên các cuộc thảo luận trước đó, ngưỡng có thể được xem như là một hoạt động
có liên quan đến việc kiểm tra đối với một chức năng T của mẫu
T = T [x, y, p (x, y), f (x, y)] ( 10.3-1)
trong đó f (x, y) là mức xám của điểm (x, y) và p (x, y) biểu thị một số bất động sản
địa phương của điểm-cho ví dụ này, mức độ màu xám trung bình của một khu phố tập
trung vào (x, y) . Một hình ảnh ngưỡng g (x, y) được định nghĩa là
( 10.3-2)
Do đó, các điểm ảnh được dán nhãn 1 (hoặc bất kỳ cấp độ màu xám tiện lợi khác)
= i '(x, y) + r’(x, y).
Từ lý thuyết xác suất Papoulis [1991] ) , nếu i '( x, y) và r' ( x, y) là các biến ngẫu
nhiên độc lập , các biểu đồ của z ( x, y) được cho bởi chập của các biểu đồ của i '( x,
y) và r' ( x, y) . Nếu i (x , y) không đổi, i'( x, y) sẽ là liên tục cũng có, và biểu đồ của
nó sẽ là đơn giản ( như một xung ) . Phép chập của hàm này với biểu đồ mức xám của
r ' ( x, y) sẽ để lại hình dạng cơ bản của biểu đồ này không thay đổi ( thu hồi từ các
cuộc thảo luận tại mục 4.2.4 mà chập của một chức năng với một xung tương tự các
chức năng tại địa điểm của xung ) . Nhưng nếu i '( x, y) đã có một biểu đồ rộng hơn
(do sự không đồng dạng chiếu sáng ) , quá trình chập sẽ làm bẩn các biểu đồ mức
xám của r' ( x, y) , cho ra một biểu đồ cho z { x, y } có hình dạng khá khác so với biểu
đồ mức xám của r'( x, y) . Mức độ biến dạng phụ thuộc vào bề ngang của biểu đồ của
i '( x, y) , do đó phụ thuộc vào sự không giống nhau của các hàm về độ sáng .
Chúng ta đã xử lý với logarit của f (x, y), thay vì đối phó với các chức năng chụp
ảnh trực tiếp, nhưng bản chất của vấn đề được giải thích rõ ràng bằng cách sử dụng
logarit để tách các thành phần chiếu sáng và phản xạ. Cách tiếp cận này cho phép hình
thành biểu đồ được xem như là một quá trình tích chập, điều này giải thích lý do tại
sao một khe khác biệt trong biểu đồ của các hàm phản xạ có thể bị mờ bởi ánh sáng
không phù hợp.
Khi truy cập vào các nguồn chiếu sáng có sẵn, một giải pháp thường được sử dụng
trong thực tế để bù cho những phần không giống là dự án mô hình chiếu sáng trên một
bề mặt phản chiếu màu trắng liên tục. Điều này mang lại một hình ảnh g (x, y) = ki (x,
y), với k là một hằng số mà phụ thuộc vào bề mặt và i (x, y) là pattern.Then chiếu
sáng, cho bất kỳ hình ảnh của f (x, y ) = i (x, y) r (x, y) thu được với chức năng chiếu
sáng như nhau, chỉ đơn giản là chia f (x, y) bởi g (x, y) mang lại một chức năng bình
thường hóa h (x, y) = f (x , y) / g (x, y) = r (x, y) / k. Vì vậy, nếu r (x, y) có thể được
phân đoạn bằng cách sử dụng một T ngưỡng duy nhất, sau đó h (x> y) có thể được
phân đoạn bằng cách sử dụng một ngưỡng giá trị duy nhất của T / k.
10.3.3 Ngưỡng toàn cầu cơ bản
Với tham chiếu đến các cuộc thảo luận trong mục 10.3.1, đơn giản nhất trong tất cả
các kỹ thuật ngưỡng là phân vùng biểu đồ hình ảnh bằng cách sử dụng một ngưỡng
1
µµ
+
5. Lặp lại các bước 2 thông qua 4 cho đến khi sự khác biệt trong T trong lần lặp kế
tiếp nhỏ hơn một tham số được xác định trước T0.
Khi có lý do để tin rằng nền và đối tượng chiếm khu vực so sánh trong các hình ảnh,
giá trị ban đầu tốt cho T là mức xám trung bình của hình ảnh. Khi đối tượng là nhỏ so
với các khu vực bị chiếm đóng bởi nền (hoặc ngược lại), sau đó một nhóm các điểm
ảnh sẽ chiếm ưu thế trong biểu đồ và mức độ màu xám trung bình không phải là một
sự lựa chọn tốt ban đầu. Một giá trị ban đầu thích hợp hơn cho T trong trường hợp
như thế này là một giá trị giữa chừng giữa các cấp độ màu xám tối đa và tối thiểu. T
0
các tham số được sử dụng để ngăn chặn các thuật toán sau khi thay đổi trở nên nhỏ về
thông số này. Này được sử dụng khi tốc độ lặp đi lặp lại là một vấn đề quan trọng.
EXAMPLE 10.11: Image segmentation using an estimated global threshold.
Hình 10.29 cho thấy một ví dụ về phân đoạn dựa trên một ngưỡng ước tính bằng cách
sử dụng thuật toán trước đó. Hình 10.29 (a) là hình ảnh ban đầu, và hình. 10.29 (b) là
biểu đồ hình ảnh. Lưu ý các khe rõ ràng của biểu đồ. Áp dụng các thuật toán lặp đi lặp
lại dẫn đến một giá trị 125,4 sau khi ba lần lặp lại bắt đầu với mức độ trung bình và
màu xám
T
0
= 0. Kết quả thu được sử dụng T = 125 phân đoạn hình ảnh ban đầu được thể hiện
trong hình. 10.29 (c). Như đã phân định rõ ràng các chế độ trong biểu đồ, các phân
hóa giữa các đối tượng và hình nền là rất hiệu quả.
10.3.4 Thresholding thích ứng cơ bản
Như minh họa trong Fig.10.27 yếu tố hình ảnh như chiếu sáng không đồng đều có thể
chuyển đổi một biểu đồ hoàn hảo segmentable vào một biểu đồ mà không thể được
rõ ràng và thung lũng. Các biểu đồ khác là gần như unimodal, không có phân biệt rõ
ràng giữa các đối tượng và nền
Hình 10.31 (d) cho thấy subimage không được chia nhỏ thành subimages nhỏ
hơn nhiều, và hình. 10.31 (e) cho thấy biểu đồ của hàng đầu, trái nhỏ subimage.This
subimage có sự chuyển tiếp giữa đối tượng và nền. Subimage này nhỏ hơn có một
biểu đồ rõ ràng hai mốt và phải được dễ dàng segmentable. Điều này, trên thực tế, là
trường hợp, như thể hiện trong hình. 10.31 (f). Con số này cũng cho thấy các phân
đoạn của tất cả các subimages nhỏ khác. Tất cả những subimages có một biểu đồ gần
unimodal, và mức độ màu xám trung bình của họ là gần hơn với đối tượng hơn nền, vì
vậy tất cả chúng được xếp vào nhóm đối tượng. Nó là trái như một dự án để cho người
đọc thấy rằng phân khúc đáng kể chính xác hơn có thể đạt được bằng cách phân chia
toàn bộ hình ảnh trong hình. 10.30 (a) vào subimages của kích thước hình. 10.31 (d)
Ngưỡng tối ưu và thích ứng toàn cầu
Trong phần này, chúng tôi thảo luận về phương pháp ước lượng ngưỡng đầu ra tối
thiểu lỗi phân vùng trung bình . Như một minh hoạ, phương pháp này được áp dụng
cho một vấn đề đòi hỏi phải có giải pháp của một số vấn đề quan trọng tìm thấy
thường xuyên trong các ứng dụng thực tế của ngưỡng
Hình 10.31 (a) subimages phân đoạn đúng và không đúng từ hình, 10.30. (b) - (c)
biểu đồ tương ứng, (d) chia nhỏ hơn nữa của subimage phân đoạn không đúng , (e)
Histogram của subimage nhỏ ở đầu , trái, (f) Kết quả phân chia thích nghi (d)
Giả sử rằng một hình ảnh chỉ chứa hai vùng màu xám cấp chính. Cho z biểu thị giá
trị màu xám cấp. Chúng ta có thể xem các giá trị như số lượng ngẫu nhiên, và biểu đồ
của họ có thể được coi là một ước tính hàm mật độ xác suất (PDF), p (z). Hàm mật độ
tổng thể này là tổng hợp hoặc hỗn hợp của hai mật độ. một cho ánh sáng và một cho
các vùng tối trong hình ảnh. Hơn nữa, các thông số hỗn hợp là tỷ lệ thuận với khu vực
tương đối của các vùng tối và sáng. Nếu hình thức của mật độ được biết đến hoặc đã
thừa nhận, nó có thể xác định một ngưỡng tối ưu (về lỗi tối thiểu) để phân chia hình
ảnh thành hai khu vực riêng biệt.
Hình 10.32 cho thấy hai hàm mật độ xác suất. Cho rằng lớn hơn mô tả các mức độ
màu xám của các đối tượng trong hình ảnh. Hàm mật độ xác suất hỗn hợp mô tả các
(z) bên trái của ngưỡng. Tương tự như
vậy, xác suất lỗi phân loại một điểm đối tượng như nền
E
2
(T) = (10.3-8)
which is the area under the curve of p
1
(z) to the right of T. Then the overall
probability of error is
E(T) = P
2
E
1
(T) + P
1
E
2
(T) (10.3-9)
Lưu ý rằng số lượng E
1
và E
2
quan trọng (tầm quan trọng nhất định) bởi xác suất
xuất hiện của các đối tượng hoặc ảnh nền. Cũng lưu ý rằng các kí hiệu trái ngược
nhau. Đây đơn giản để giải thích. Xem xét, ví dụ, trường hợp cực đoan, trong đó điểm
nền được biết đến không bao giờ xảy ra. Trong trường hợp này P
2
= 0. Đóng góp cho
sự lỗi tổng thể (E) phân loại một điểm nền là một điểm đối tượng (E
1
Trong trường hợp này:
p(z) = + (10.3-11)
nơi and là giá trị trung bình và phương sai của mật độ Gauss của một lớp học của các
điểm ảnh (nói, các đối tượng) và and là giá trị trung bình và phương sai của các lớp
khác. Sử dụng phương trình này trong các giải pháp chung của phương trình. (10.3-
10) kết quả trong các giải pháp sau đây đối với ngưỡng T
A + BT + C = 0 (10.3-12)
Khi đó
A =
B = (10.3-13)
C = +
Từ một phương trình bậc hai có hai giải pháp có thể, hai giá trị ngưỡng có thể
được yêu cầu để có được những giải pháp tối ưu.
Nếu phương sai bằng nhau ngưỡng duy nhất là đủ:
T = (10.3-14)
Thay vì giả định một hình thức chức năng cho p (z), một cách tiếp cận có nghĩa là
vuông lỗi tối thiểu có thể được sử dụng để ước tính một hỗn hợp màu xám PDF cấp
một hình ảnh từ các hình ảnh từ biểu đồ. Ví dụ, lỗi vuông trung bình giữa (liên tục)
hỗn hợp mật độ p (z) và (rời rạc) hình ảnh biểu đồ
h (z
i
) là
e
ms =
(10.3-15)
nơi một biểu đồ n-điểm được giả định. Lý do chính cho việc đánh giá mật độ hoàn
thành là để xác định có hay không có chế độ chiếm ưu thế trong các file PDF. Ví dụ,
hai chế độ chi phối cho thấy sự hiện diện của các cạnh trong hình ảnh (hoặc khu vực)
trong đó các file PDF được tính
Nói chung, phân tích xác định các thông số để giảm thiểu lỗi này hình vuông có
vắng mặt của hai khu vực riêng biệt rõ rệt.
Sau khi tất cả 49 biểu đồ được tính toán, một bài kiểm tra bimodality được thực
hiện để loại bỏ các biểu đồ còn lại histograms.The unimodal sau đó được trang bị bởi
hai đỉnh đường cong mật độ Gaussian [xem phương trình. (10,3-11)] sử dụng một
gradient liên hợp đồi leo phương pháp để giảm thiểu hàm lỗi được đưa ra trong
phương trình. (10,3-15). X và O trong hình. 10.34 (a) là hai phù hợp với biểu đồ thể
hiện trong các chấm đen. Các ngưỡng tối ưu đã được sau đó thu được bằng cách sử
dụng EQS. (10,3-12) và (10,3-13).
Ở giai đoạn này của quá trình chỉ các khu vực với biểu đồ hai mốt được phân
ngưỡng. Các ngưỡng cho các khu vực còn lại đã thu được bằng cách nội suy các
ngưỡng này. Sau đó, một suy thứ hai được thực hiện từng điểm bằng cách sử dụng các
giá trị ngưỡng lân cận do đó, vào cuối các thủ tục, tất cả các điểm trong hình ảnh đã
được chỉ định một ngưỡng. Cuối cùng, một quyết định nhị phân được thực hiện cho
mỗi điểm ảnh bằng cách sử dụng quy tắc.
Sử dụng các đặc tính biên cho cải thiện biểu đồ và Thresholding cục bộ
Dựa trên các cuộc thảo luận trong các năm phần trước, nó là trực giác rõ ràng
rằng cơ hội để lựa chọn một ngưỡng "tốt" được tăng cường đáng kể nếu các đỉnh biểu
đồ là cao, hẹp, đối xứng, và cách nhau bởi các thung lũng sâu. Một cách tiếp cận để
cải thiện hình dạng của biểu đồ là để xem xét chỉ những điểm ảnh nằm trên hoặc gần
các cạnh giữa các đối tượng và hình nền. một cải tiến ngay lập tức và rõ ràng là biểu
đồ sẽ ít phụ thuộc vào kích thước tương đối của các đối tượng và nền. Ví dụ, biểu đồ
của một hình ảnh bao gồm một đối tượng nhỏ trên một diện tích nền lớn (hoặc ngược
lại) sẽ được thống trị bởi một đỉnh lớn do nồng độ cao của một loại các điểm ảnh. hình
10.30 và 10.31 là một minh họa tốt về cách thức thực hiện phân chia nhỏ bị ảnh hưởng
bởi điều này điều kiện.
Nếu chỉ có các điểm ảnh trên hoặc gần mép giữa các đối tượng và hình nền được sử
dụng, biểu đồ kết quả sẽ có đỉnh xấp xỉ cùng một chiều cao. Ngoài ra, khả năng mà
bất kỳ của những điểm ảnh được nằm trên một đối tượng sẽ được xấp xỉ bằng xác suất
mà nó nằm trên nền, do đó cải thiện tính đối xứng của các đỉnh biểu đồ. Cuối cùng.
như đã nêu trong các đoạn sau đây, sử dụng điểm ảnh đáp ứng một số biện pháp đơn
ánh sáng cho một đối tượng tối phải được đặc trưng bởi sự xuất hiện của một - theo
sau là một + trong s (x, y). Bên trong các đối tượng bao gồm các điểm ảnh được dán
nhãn hoặc là 0 hoặc +. Cuối cùng, quá trình chuyển đổi từ đối tượng quay trở lại nền
được đặc trưng bởi sự xuất hiện của một + theo sau là một - Như vậy, một dòng quét
ngang hoặc thẳng đứng chứa một phần của một đối tượng có cấu trúc sau
( ) (-, +) (0 hoặc +) (+, -) ( )
( ) đại diện cho bất kỳ sự kết hợp của +, -, và 0. Các dấu ngoặc chứa đối tượng, điểm
và được dán nhãn 1. Tất cả các điểm khác dọc theo đường quét tương tự được dán
nhãn 0, ngoại trừ bất kỳ chuỗi khác (0 hoặc +) giới hạn bởi (-, +) và (+, -).
Hình 10.37 (a) cho thấy một hình của một ảnh kiểm tra ngân hàng bình thường .
Hình 10.38 cho thấy biểu đồ như một chức năng của các giá trị độ dốc cho các điểm
ảnh với độ dốc lớn hơn 5. Lưu ý rằng biểu đồ này có hai chế độ chi phối là đối xứng.
gần của cùng một chiều cao, và được ngăn cách bởi một thung lũng riêng biệt. Cuối
cùng. Vả. 10,37 (b) cho thấy hình ảnh phân đoạn thu được bằng cách sử dụng phương
trình. (10,3-16) với tôi tại hoặc gần trung điểm của thung lũng. Kết quả đã được thực
hiện nhị phân bằng cách sử dụng các phân tích trình tự chỉ thảo luận. Lưu ý rằng ví dụ
này là một minh chứng của ngưỡng cục bộ , như được định nghĩa trong phương trình.
(10,3-1), bởi vì giá trị của T được xác định từ một biểu đồ của gradient và Laplacian,
là thuộc tính cục bộ
.
Ngưỡng cơ bản dựa trên một số biến
Vì vậy, đến nay chúng tôi đã quan tâm đến ngưỡng mức màu xám. Trong một số
trường hợp, một bộ cảm biến có thể làm cho có sẵn nhiều hơn một biến để mô tả mỗi
điểm ảnh trong một hình ảnh, và do đó cho phép theresholding đa phổ. Như thảo luận
chi tiết trong phần 6.7, màu sắc hình ảnh là một ví dụ điển hình, trong đó mỗi điểm
ảnh được đặc trưng bởi ba giá trị RGB, trong trường hợp này, việc xây dựng một 3-D
"biểu đồ" trở thành có thể. Các thủ tục cơ bản là tương tự như phương pháp sử dụng
cho một biến. Ví dụ, đối với một hình ảnh với ba biến (các thành phần RGB), từng có
16 cấp độ có thể, một x 16 lưới 16 x16 (khối lập phương) được hình thành. chèn trong
mỗi tế bào của khối lập phương là số lượng điểm ảnh có các thành phần RGB có giá
đương được thực hiện bởi con người, chẳng hạn như trong việc kiểm tra các loại trái
cây cho chín hoặc trong việc kiểm tra hàng hóa sản xuất. Như đã đề cập trong Chương
6,the Hue, Saturation, Cường độ (HSI) mô hình lý tưởng cho các loại ứng dụng bởi vì
nó liên quan chặt chẽ đến cách thức mà con người mô tả nhận thức về màu sắc. Một
cách tiếp cận phân khúc bằng cách sử dụng màu sắc và độ bão hòa các thành phần của
một tín hiệu màu sắc cũng đặc biệt hấp dẫn, vì nó liên quan đến 2-D cụm dữ liệu được
dễ dàng hơn để phân tích hơn, nói rằng, các cụm 3-D cần thiết cho RGB phân khúc.
10.4 Phân đoạn vùng cơ bản
Mục tiêu của phân khúc là phân chia một hình ảnh thành các vùng. Trong Mục
10.1 và 10.2, chúng tôi tiếp cận vấn đề này bằng cách tìm ranh giới giữa các khu vực
dựa trên không liên tục trong mức độ màu xám, trong khi đó tại mục 10.3 phân chia
được thực hiện thông qua các ngưỡng dựa trên việc phân phối các tính điểm ảnh,
chẳng hạn như giá trị màu xám cấp hoặc màu sắc. Trong phần này, chúng tôi thảo
luận về kỹ thuật phân chia nhỏ dựa trên việc tìm kiếm các khu vực trực tiếp.
10.4.1 Công thức cơ bản
Cho R đại diện cho toàn bộ khu vực hình ảnh. Chúng tôi có thể xem như một quá trình
phân chia phân vùng R vào n tiểu vùng R
1
, R
2
, ,R
n
sao cho
(a) = R
(b) Ri is a connected region i = 1,2, …,n
(c) Ri = Ø for all i and j , i ≠ j
(d) P (Ri) = TRUE for i = 1,2, …,n
(e) P (Ri ) =FALSE for i ≠ j
Dưới đây, P (Ri) là một vị từ logic xác định qua các điểm trong thiết Ri và Ø tập vô
giá trị.
của các điểm ảnh chỉ có ba giá trị màu xám cấp riêng biệt. Nhóm pixel với mức cùng
một màu xám để tạo thành một "khu vực" mà không chú ý đến kết nối sẽ mang lại
một kết quả phân đoạn đó là vô nghĩa trong cuộc thảo luận này.
Một vấn đề khác phát triển trong khu vực là xây dựng một quy luật dừng lại. Về cơ
bản, phát triển một khu vực nên dừng lại khi không có nhiều điểm ảnh đủ tiêu chuẩn
để đưa vào khu vực đó. Các tiêu chí như mức độ màu xám, kết cấu và màu sắc, là địa
phương trong tự nhiên và không có tính "lịch sử" của tăng trưởng khu vực. Tiêu chí
bổ sung làm tăng sức mạnh của một thuật toán region-growing sử dụng các khái niệm
về kích thước, giống như giữa một điểm ảnh ứng cử viên và các điểm ảnh phát triển
cho đến nay (như so sánh về mức độ màu xám của một ứng cử viên và các cấp độ màu
xám trung bình của khu vực phát triển), và hình dạng của khu vực đang được trồng.
Việc sử dụng các loại mô tả là dựa trên giả định rằng một mô hình của kết quả mong
đợi ít nhất là một phần có sẵn.
Hình 10.40 (a) cho thấy một hình ảnh X-quang của một mối hàn (khu vực tối
ngang) có chứa một số vết nứt và porosities (sáng, vệt trắng chạy ngang qua giữa của
hình ảnh). Chúng tôi muốn sử dụng khu vực đang phát triển để phân đoạn các khu vực
của thất bại hàn. Các tính năng phân đoạn có thể được sử dụng để kiểm tra, để đưa
vào một cơ sở dữ liệu của nghiên cứu lịch sử, để điều khiển một hệ thống hàn tự động,
và cho nhiều ứng dụng khác.
10.4 Vùng tách và sát nhập
Thủ tục chỉ thảo luận phát triển khu vực từ một tập hợp các điểm hạt giống. Một
cách khác là chia nhỏ một hình ảnh ban đầu vào một tập hợp các tùy ý, khu vực rời
rạc và sau đó hợp nhất và phân chia các khu vực trong một nỗ lực để đáp ứng các điều
kiện quy định tại mục 10.4.1. Một sự chia rẽ và hợp nhất các thuật toán mà lặp đi lặp
lại quá trình tiến tới đáp ứng những khó khăn này được phát triển tiếp theo.
Cho R đại diện cho toàn bộ khu vực hình ảnh và chọn một vị P. Một cách tiếp cận
đối với phân khúc R là chia nhỏ tiếp thành các vùng hạ sườn nhỏ hơn và nhỏ hơn do
đó, đối với bất kỳ Ri khu vực, P (Ri) = TRUE. Chúng tôi bắt đầu với toàn bộ khu vực.
Nếu P (R) = FALSE, chúng tôi chia hình ảnh vào góc phần tư. Nếu P là FALSE cho
bất kỳ góc phần tư, chúng tôi chia nhỏ góc phần tư đó vào subquadrants, và như vậy.
) = TRUE.
(3) Dừng lại khi không tiếp tục sáp nhập hoặc chia tách được
Một số dạng biến thể cơ bản của đề tài trước đó là có thể. Ví dụ, một khả năng là
để phân chia các hình ảnh ban đầu vào một tập hợp các khối. Tách xa hơn được thực
hiện như mô tả trước đây, nhưng kết hợp ban đầu giới hạn ở nhóm bốn khối là lớp sau
trong các đại diện cây phần tư và đáp ứng các vị P . Khi không tiếp tục hợp nhất của
loại này là có thể, thủ tục được kết thúc bằng một kết hợp cuối cùng của khu vực đáp
ứng bước 2. Tại thời điểm này, các khu vực sáp nhập có thể có kích thước khác nhau.
Ưu điểm chính của phương pháp này là nó sử dụng cây phần tư tương tự cho tách và
sáp nhập, cho đến khi bước hợp thức
10.5 Phân đoạn theo hình thái lưu vực
Như vậy đến nay, chúng ta đã thảo luận phân chia dựa trên ba khái niệm chính:
(a) phát hiện các bất liên tục, (b) ngưỡng, và (c) xử lý khu vực. Mỗi phương pháp đã
được tìm thấy để có lợi thế (ví dụ, tốc độ trong trường hợp ngưỡng toàn bộ) và bất lợi
(ví dụ, sự cần thiết phải xử lý sau, chẳng hạn như cạnh liên kết, trong các phương
pháp dựa trên phát hiện các bất liên tục trong mức độ màu xám). Trong phần này
chúng ta thảo luận một cách tiếp cận dựa trên các khái niệm về cái gọi là lưu vực hình
thái. Như sẽ trở nên rõ ràng trong các cuộc thảo luận sau đây, phân khúc của hình thái
đầu là hiện thân của nhiều khái niệm của ba cách tiếp cận khác, và như vậy, thường
cho ra kết quả phân chia ổn định hơn, trong đó có ranh giới phân chia liên tục. Cách
tiếp cận này cũng cung cấp một khuôn khổ đơn giản để kết hợp các ràng buộc dựa trên
hiểu biết cơ bản (xem hình. 1.23) trong quá trình phân chia.
10.5.1 Khái niệm cơ bản
Các khái niệm về lưu vực dựa trên hình dung một hình ảnh trong ba kích thước: hai
tọa độ không gian so với mức màu xám. Trong một giải thích như vậy "địa hình",
chúng ta xem xét ba loại điểm: (a) điểm thuộc về một tối thiểu vùng (b) điểm mà tại
đó một giọt nước, nếu đặt ở vị trí của bất kỳ của những điểm, sẽ rơi với chắc chắn đến
mức tối thiểu duy nhất, và (c) điểm mà tại đó nước sẽ được bình đẳng có thể sẽ giảm
nhiều hơn một mức tối thiểu như vậy. Tối thiểu đặc biệt trong khu vực, tập hợp các
điểm thỏa mãn điều kiện (b) được gọi là lưu vực lưu vực đầu nguồn hoặc tối thiểu đó.
chi tiết của việc xây dựng đập sẽ được thảo luận trong phần sau ) . Hiệu quả là rõ rệt
hơn như nước tiếp tục tăng, như thể hiện trong hình . 10,44 ( g ) . Con số này cho thấy
một đập dài giữa hai lưu vực lưu vực và một con đập ở phần trên của lưu vực bên phải
.Đập thứ hai được xây dựng để ngăn chặn việc sáp nhập của nước từ lưu vực nước từ
các khu vực tương ứng với nền. Quá trình này được tiếp tục cho đến mức tối đa của lũ
lụt (tương ứng với giá trị màu xám-mức cao nhất trong hình ảnh) là đạt. Các đập thức
tương ứng với các dòng đầu nguồn, đó là kết quả phân khúc mong muốn. Kết quả ví
dụ này được thể hiện trong hình. 10,44 (h) như bóng tối, con đường một điểm ảnh dày
chồng lên hình ảnh ban đầu. Lưu ý các tài sản quan trọng là các dòng đầu nguồn tạo
thành một con đường kết nối, do đó đưa ra ranh giới liên tục giữa các vùng.
Một trong những ứng dụng chính của phân đoạn đầu nguồn là trong việc khai thác
gần như thống nhất (bloblike) các đối tượng từ phía sau. Các khu vực đặc trưng bởi sự
thay đổi nhỏ trong mức độ màu xám có giá trị độ dốc nhỏ. Vì vậy, trong thực tế,
chúng ta thường thấy phân khúc đầu nguồn áp dụng cho gradient của một hình ảnh,
chứ không phải là hình ảnh của chính nó. Trong công thức này, các tiểu khu vực lưu
vực tương quan độc đáo với giá trị nhỏ của gradient tương ứng với các đối tượng quan
tâm.
10.5.2 Xây dựng vách ngăn (chắn)
Trước khi tiếp tục, chúng ta xem xét làm thế nào để xây dựng các vách ngăn hoặc
đường biên theo yêu cầu của thuật toán phân vùng biên . Xây dựng đập được dựa trên
hình ảnh nhị phân, là thành viên của 2-D số nguyên không gian Z
2
(xem Phần 2.4.2).
Cách đơn giản nhất để xây dựng đập tách bộ điểm nhị phân là sử dụng sự giãn nở hình
thái (xem Phần 9.2,1).
Điều cơ bản là làm thế nào để xây dựng đập sử dụng sự giãn nở được minh họa
trong hình. 10.45. Hình 10.45 (a) cho thấy các phần của hai lưu vực lưu vực trong khi
tràn bước n - 1 và hình. 10.45 (b) cho thấy kết quả ở bước tiếp theo của việc tràn , n.
Các nước đã đổ từ một lưu vực khác và, do đó, một con đập phải được xây dựng để
giữ cho điều này xảy ra. Để phù hợp với ký hiệu được giới thiệu trong thời gian ngắn,
được mở rộng thống nhất
Trong sự giãn nở thứ hai ( thể hiện trong môi trường màu xám) , một số điểm bij
lỗi điều kiện ( 1 ) trong khi điều kiện cuộc họp (2) , kết quả là hình dạng bị gãy đươc
chỉ ở hình . Nó cũng là điều hiển nhiên rằng các điểm chỉ trong q đáp ứng hai điều
kiện được xem xét mô tả con đường một điểm ảnh dày kết nối thể hiện vượt nở trong
hình . 10.45 ( d ) . Con đường nàycấu tạo để tách rời ở hoạt động n của việc tràn. Xây
dựng đập ở mức độ lũ lụt được hoàn thành bằng cách thiết lập tất cả các điểm trong
đường dẫn chỉ xác định một giá trị lớn hơn giá trị màu xám - mức tối đa của hình ảnh .
Chiều cao của tất cả các vách ngăn thường được đặt ở 1 cộng với giá trị tối đa cho
phép trong hình ảnh. Điều này sẽ ngăn chặn nước từ băng qua một phần của vách
ngăn được hoàn thành như mức độ tràn ngập tăng lên. Điều quan trọng cần lưu ý rằng
các vách ngăn được xây dựng theo cách này , đó là ranh giới phân chia nhỏ mong
muốn , được kết nối với các thành phần . Nói cách khác, phương pháp này giúp loại
bỏ vấn đề khi đường phân chia nhỏ bị hỏng .
Dù các thủ tục được mô tả dựa trên một ví dụ đơn giản, phương pháp được sử dụng
cho các tình huống phức tạp hơn là giống hệt nhau, bao gồm cả việc sử dụng các yếu
tố cấu trúc 3x 3 được chỉ ở hình 10.45 (c).
10.5.3 Thuật toán phân vùng biên
Cho M
1
M
2 ……
M
R
là bộ biểu thị tọa độ của các điểm trong tiểu khu vực của một hình
ảnh g (x, y). Như đã trình bày ở phần cuối của mục 10.5.1, điều này thường sẽ là một
hình ảnh gradient. Cho C (M
i
) là một tập hợp biểu thị tọa độ của các điểm trong lưu
vực lưu vực kết hợp với tối thiểu vùng M