Nâng cao chất lượng hình ảnh bằng phép toán hình thái, kỹ thuật tìm xương và làm mảnh - Pdf 25

Trang 1 Nâng cao chất lượng hình ảnh bằng phép
toán hình thái, kỹ thuật tìm xương và
làm mảnh / Nguyễn Minh Đức ; Nghd. :
PGS.TS.Ngô Quốc Tạo
LỜI NÓI ĐẦU
Ảnh là một dạng dữ liệu đóng vai trò quan trọng trong việc trao đổi, xử
lý, lưu giữ thông tin Trong nhiều ngành nghề, trong một số các loại hình công
việc, người ta điều cần đến hình ảnh để mô tả, minh chứng hay diễn đạt những
điều mà đôi khi chữ viết hay ngôn ngữ nói không lột tả hết được. Trong hầu hết
các ngành như: Thiết kế cơ khí, Thiết kế xây dựng, Thiết kế mạch điện việc
đọc hình ảnh có thể nói là thường xuyên và cực kỳ quan trọng. Bản vẽ kỹ thuật
(một dạng của hình ảnh) chính là kết quả ngôn ngữ kỹ thuật, Mà qua nó, một
qui trình công nghệ phải được xây dựng trong quá trình sản xuất, cũng như nó
chính là cơ sở cho việc nghiệm thu cho bất kỳ sản phẩm nào Để lưu ảnh của
các tài liệu, các bản vẽ hoặc sửa đổi chúng và chuyển chúng sang các dạng đồ
hoạ khác tiện cho việc nhận dạng, đối sánh mẫu để sử dụng sau này là điều cần
thiết. Nhưng phải tổ chức việc lưu các dạng hình ảnh này như thế nào? Có cần
xử lý gì trước khi lưu chúng không? Câu trả lời là có. Do vậy tiền xử lý ảnh là
việc cần làm. Có nhiều phương pháp, nhiều công cụ, nhiều phần mềm xử lý ảnh
Trang 2 đã ra đời. Tăng cường chất lượng ảnh, mà công đoạn đầu tiên là một bước tiền
xử lý nhằm loại bỏ nhiễu, khắc phục những khiếm khuyết do bước thu nhận ảnh
không tốt là việc làm quan trọng. Có nhiều phương pháp cho việc nâng cao chất
lượng ảnh nói chung và tiền xử lý nói riêng. Trong luận văn này chỉ mô tả một
vài phương pháp tiền xử lý hình ảnh, (chú trọng đến ảnh nhị phân, bởi ảnh của
các bản vẽ kỹ thuật thường chỉ là ảnh 2 màu: đen, trắng) để cải thiện chất lượng

trúc sử dụng thuật toán di truyền.
Chương 4: Cài đặt chương trình thử nghiệm.
Trình bày một số thử nghiệm cho thao tác tìm xương, làm mảnh ảnh.
Kết Luận

CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP NÂNG
CAO CHẤT LƯỢNG HÌNH ẢNH
1.1 Giới thiệu chung về xử lý ảnh:
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các
Trang 4 ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi,
để truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh giá
các nội dung của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh
thành những phần có nghĩa để phân biệt đối tượng này với đối tượng khác. Dựa
vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng biên
của một đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh Kỹ thuật này được sử
dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).

là công việc tăng cường hình ảnh (Image Enhancement) để nâng cao chất lượng
hình ảnh. Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do
nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải tăng cường
và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số đặc tính chính
của ảnh, hay làm cho ảnh gần giống với trạng thái gốc - trạng thái trước khi ảnh
bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như biên (Edge
Detection), phân vùng ảnh (Image Segmentation), trích chọn các đặc tính
(Feature Extraction),v.v
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính của quá trình xử lý ảnh
có thể mô tả ở hình 1.1.
1.2 Giới thiệu ảnh nhị phân:

1.2.1 Một số khái miệm:

• Pixel (Picture Element): Phần tử ảnh.
Trang 6 Trong quá trình số hoá, ngươì ta biến đổi tín hiêụ liên tục sang tín hiệu rời
rạc thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành
phần giá trị mà về nguyên tắc, mắt thường không phân biệt được hai điểm kề
nhau. Trong quá trình này, người ta sử dụng khái niệm Picture Element mà ta
quen gọi hay viết là pixel ( phần tử ảnh). Như vậy một ảnh là một tập hợp các
pixel. Mỗi pixel gồm một cặp toạ độ x, y và màu.
• Ảnh nhị phân: Ảnh chỉ có giá trị 0 hoặc 1 thì ta nói đó là một ảnh nhị
phân hoặc ảnh đen trắng.
Trang 7
có thể được viết lại là {(3, 3), (3, 4), (4, 3), (4, 4) }, với điểm ảnh phía trên bên
trái là (0, 0). Tuy nhiên, việc viết như vậy sẽ rất dài dòng và bất tiện nên ta gọi
đơn giản đối tượng ảnh là A, và các phần tử trong đó là các điểm ảnh.
2.2.1. Phép dãn nhị phân (Dilation):

• Phép dịch A bởi điểm x (hàng, cột)
(A)
x
= {c | c = a + x, a ∈ A} (EQ 2.1)
• Phép đối của tập A được định nghĩa như sau:
Â= {c | c = - a, a ∈ A } (EQ 2.2)
đó chính là phép quay A một góc 180° quanh gốc tọa độ.
• Phần bù của tập A là tập các điểm ảnh không thuộc đối tượng A, ở đây
chính là các điểm ảnh trắng. Theo lý thuyết tập hợp thì:
Hình 2.1:
Hiệu quả của thao tác nhị phân đơn giản trên một ảnh nhỏ.
(a) Ảnh ban đầu
(b) Ảnh dãn 1 điểm ảnh
(c) Ảnh dãn 2 điểm ảnh (so với ảnh ban đầu).
Trang 9 A
c


Phần tử cấu trúc
Hình 2.2 Dãn A bơỉ B
a) Tập A ban đầu.
b) Tập A cộng phần tử (0, 0).
c) Tập A cộng phần tử (0, 1).
d) Hợp của (b) và (c) Kết quả của phép dãn
Trang 10 Nhìn hình 2.2 trên, ta nhận thấy rằng trong các ảnh có hình 1 dấu thập

××
×). Những phần tử được đánh dấu (×) hoặc đen, hoặc trắng được coi như gốc
(Ogirin) của mỗi ảnh. Việc xác định vị trí của gốc cấu trúc là rất quan trọng, nó
có thể quyết định hướng co, dãn của ảnh. Nếu gốc ở bên trái, thì ảnh có xu
hướng co, dãn về bên phải, gốc ở bên phải thì co, dãn về trái và nếu gốc ở giữa,
tất nhiên, ảnh sẽ dãn đều. Trong thí dụ trên do gốc của cấu trúc B ở bên trái nên
ta thấy ảnh được dãn về bên phải.
Tổng quát hơn, ta có thể coi phép dãn (dilation) là hợp của tất cả các
phép dịch bởi các phần tử của cấu trúc, kí hiệu:
(EQ 2.8)

Tuy nhiên với vai trò bình đẳng của A và B, ta coi A là cấu trúc và B là ảnh
thì khi đó:
(EQ 2.9)Từ những điều trên, giúp ta tiếp cận đến một thao tác dãn ảnh có thể được “
máy tính hóa “. Ta hãy xem những phần tử cấu trúc như là một mẫu và dịch nó


Phép co một ảnh A bởi cấu trúc B có thể được định nghĩa như là tập:
A Θ B = {c |(B)
c
⊆ A} (EQ 2.10)
Nói cách khác, đó là tập hợp các điểm ảnh c ∈ A, mà nếu cấu trúc B dịch
chuyển theo các toạ độ của c, thì B vẫn nằm trong đối tượng ảnh A, tức B là
một tập con của đối tượng ảnh cần co A. Hình 2.5:Phép co nhị phân dùng cấu trúc đơn giản
Trang 12 Quan hệ giữa phép co và phép dãn có mối quan hệ qua biểu thức sau đây:
(A Θ B)
c
= A
c
⊕ BÂ (EQ 2.11)
Theo định nghĩa của phép co ở trên, ta có:
A Θ B = {z|(B)
z
⊆ A}
Khi đó phần bù của phép co là:
(A Θ B)
c
= {z|(B)
z
⊆ A }

X ⊂ X’⇒ X Θ B ⊂ X’ Θ B ∀B
X ⊕ B ⊂ X’ ⊕ B ∀B
B ⊂ B’ ⇒ X Θ B ⊂ X Θ B’ ∀X
Trang 13 ♦ Tính chất đối ngẫu
X ⊕
⊕⊕
⊕ B = (X Θ B)
c

2.2.3. Các phép toán đóng mở ảnh (closing and opening
)
2.2.3.1.Phép mở:

Opening(I) = D(E(I)).
2.2.3.2.Phép đóng:

Close (I) = E(D(I))

CHƯƠNG III: NÂNG CAO CHẤT LƯỢNG ẢNH BẰNG PHƯƠNG
PHÁP TÌM XƯƠNG VÀ LÀM MẢNH
Thuật toán làm mảnh thường bao gồm nhiều lần lặp, mỗi lần lặp tất cả
các điểm của đối tượng sẽ được kiểm tra, nếu chúng thoả mãn điều kiện xoá
nào đó thì nó sẽ bị xoá đi. Quá trình được lặp lại cho đến khi không còn điểm
biên nào được xoá.
3.1 Xương và làm mảnh

Một xương được xem như sử dụng để mô tả hình dạng của đối tượng theo


Hình 3.1. Các mẫu sử dụng để nhận dạng những pixel có thể được xoá
trong thuật toán làm mảnh Stentiford
Trang 15 Hình 3.2:
Một minh hoạ về số liên kết
a) Điểm trung tâm không liên kết với bất cứ vùng nào và có thể bị xoá. Số
liên kết bằng 1
b) Nếu điểm trung tâm đã bị xoá, hai phần trái và phải sẽ trở thành không liên
kết. Số liên kết bằng 2
c) Số liên kết bằng 3
d) Số liên kết bằng 4, cực đại
Ảnh phải được quét theo một thứ tự riêng biệt đối với từng mẫu. M1: tìm
các pixel có thể xoá được dọc theo biên trên của đối tượng, từ trái qua phải.
Mẫu M2 di chuyển từ dưới lên trên, từ trái qua phải của hình ảnh. M3 sẽ định
vị các pixel dọc theo biên dưới và di chuyển từ phải qua trái, từ dưới lên trên.
Cuối cùng mẫu M4 sẽ tìm những pixel ở bên phải của đối tượng, từ trên xuống
dưới, phải qua trái.
Thứ tự đặc biệt này và hướng áp dụng cho các mẫu, để bảo đảm rằng các
pixel sẽ được xoá cân đối, tránh được sự sai lệch hướng.
Có 2 khái niệm mới và cả 2 được nêu trong bước 2.
• Điểm cuối (End point): Chỉ kết nối với một pixel đen khác.
• Số liên kết : pixel đơn kết nối với 2 bộ phận rộng của một đối tượng. (a) (b) (c) (d) (e)
trắng (điểm ảnh nền) và giá trị của N
k
là 0 nếu điểm ảnh là điểm đen (điểm ảnh
thuộc đối tượng). Điểm ảnh trung tâm là N
0
và N
k
= N
k
- 8 nếu k > 8. Một cách
khác giá trị liên kết có thể được tính toán bằng cách xét các điểm láng giềng
theo thứ tự: N
1,
N
2,
Ns
,
N
1.
Số các thay đổi màu (đen-trắng) được sử dụng
đếm số vùng điểm ảnh trung tâm kết nối.
Hình 3.3:
Bốn phần của mỗi phép lặp trong làm mảnh Stentiford
a) Sau khi áp dụng mẫu M1 b) Sau mẫu M2 c) Sau M3 d) Sau M4.
Để hoàn chỉnh việc làm mảnh đối tượng này đòi hỏi 13 vòng lặp (vòng lặp
sau cùng không làm điều gì ngoại trừ việc hiển thị điều mà chúng ta đã hoàn tất).
Có một vài vấn đề vẫn tồn tại trong thuật toán làm mảnh này đó là việc

Các mẫu được dùng cho bước xử lý góc nhọn quan trọng.
Trang 18 Làm trơn (smoothing) được hoàn tất đầu tiên, tiếp theo là tất cả các quá
trình duyệt qua ảnh của các góc nhọn quan trọng. Cuối cùng là các bước làm
mảnh ảnh. Hình 3.7 trình bày các xương kết quả cuối cùng của các kí tự trong
hình 3.5 khi các bước tiền xử lý được gộp vào. Hình 3.7:
Những kí tự được làm mảnh cuối cùng, sau cả hai bước tiền xử lý
và làm mảnh.
Hầu hết các xương xuất hiện khi sử dụng phương pháp này vẫn bị rạn
nứt. Cách sử dụng 3 giai đoạn của các góc nhọn quan trọng sẽ không hiệu quả
đối với các kí tự rất dày, và các mẫu không phù hợp với tất cả các tình huống
mà có thể gây ra cổ cột và đuôi cột. Cũng như vậy, bước làm trơn sẽ không bắt
gặp các bất quy tắc mà các bất quy tắc này có thể tạo nên các đưòng xơ.
Thuật toán làm mảnh song song Zhang-Suen (Zhang 1984): Thuật toán
được ngắt thành hai vòng lặp con để thay thế, ví dụ: thay vì 4 vòng lặp con của
thuật toán Stentiford. Trong một vòng lặp con, một điểm ảnh I(i, j) được xoá
(hay được đánh dấu cho thao tác xoá bỏ) nếu 4 điều kiện sau đây được thoả
mãn:
1) Giá trị liên kết là 1.
2) Nó có ít nhất 2 điểm láng giềng đen và không nhiều hơn 6.
3) Có ít nhất một trong các điểm: I(i, j+1), I(i-1, j) và I(i, j-1) là nền
4) ít nhất một trong các điểm: I(i-1, j), I(i+1, j) và I(i, j-1) là điểm ảnh nền.
Tại cuối vòng lặp con này các điểm đã đánh dấu được xoá bỏ.
Trang 19


Trang 20 và W tương xứng với các điểm ảnh theo một hướng từ điểm ảnh trung tâm C: E
nghĩa là hướng đông (tương ứng với điểm ảnh I(i, j+1)), S nghĩa là hướng nam
(tương ứng với điểm ảnh I(i+1, j)), v.v
Vòng lặp con thứ 2 được viết như sau:
v(C)
^
(~edge(C) v (v(W)
^
v(N)
^
(v(S) v v(E)))) (EQ 3.3)
Holt và nhóm của ông đã kết hợp 2 biểu thức 3.2 và 3.3 với một điều kiện
kết nối bảo toàn (cần thiết cho việc thực hiện tính toán song song) và đưa ra
các biểu thức đơn dưới đây cho các điểm ảnh còn lại:
v(C)
^
(~edge(C) v
(edge(E)
^
v(N)
^
v(S)) v
(edge(S)
^
v(W)
^
v(E)) v

(~v(W) v ~v(S)) v
(v(W)
^
~v(NW)
^
~v(SE)
^
(~v(E) v ~v(S))))))

Quá trình duyệt ảnh có đường chéo hướng nam tương tự như vậy, nhưng
với chuyển đổi bắc và nam.
Hình 3.9:
Các phép biến đổi trên thuật toán làm mảnh Zhang-Suen.
a)Ảnh gốc; b) Làm mảnh theo thuật toán chuẩn; c) Làm mảnh của Holt;
d) Phép biến đổi của Holt cộng với xoá bậc thang.
Hình 3.10 trình bày kết quả việc áp dụng phương pháp này vào 4 ảnh kiểm
tra mà chúng ta đã sử dụng.

Hình 3.10: Các kết quả từ thuật toán của Holt với xoá bậc thang áp dụng
cho ảnh kiểm tra chuẩn.
Trang 22 Nếu tốc độ là vấn đề cần quan tâm đến thì việc cải tiến thuật toán Holt
của Zhang-Suen là thuật toán tốt. Mặt khác, nếu chất lượng của xương là vấn
đề quan trọng bậc nhất thì đó là một sự kết hợp của 3 phương pháp theo thứ tự:
Phương pháp tiền xử lý của Stentiford cung cấp các ảnh cho thuật toán cơ bản

để phát triển công cụ có thể cho câu trả lời sơ bộ về vấn đề phân rã tối ưu của
tập các phần tử cấu trúc không lồi thành chuỗi các phép toán cơ sở.
CHƯƠNG IV: CÀI ĐẶT CHƯƠNG TRÌNH THỬ NGHIỆM
Chương trình thử nghiệm được cài đặt bằng ngôn ngữ Visual C++ 6.0
gồm các chức năng:
- Nhập các ảnh dạng .PBM
- Minh hoạ một cách chi tiết thao tác hình thái học cụ thể đó là: Các thao
tác co, dãn ảnh, closing, opening
- Tìm xương để làm mảnh bằng cách sử dụng thuật toán stentiford cùng
với nhũng cải tiến của thuật toán nhằm làm mảnh đối tượng ảnh một cách tốt
hơn.

Trang 24 KẾT LUẬN
Luận văn đã trình bày về các phép toán hình thái học, kỹ thuật tìm xương
của ảnh. Kết hợp các phép toán hình thái với làm mảnh để nâng cao chất lượng
ảnh. Các phép toán hình thái tỏ ra rất hữu hiệu trong cải thiện ảnh, tuy nhiên nó
hoàn toàn phụ thuộc vào mẫu ban đầu. Do đó luận văn cũng trình bày phương
pháp phân rã phân tử cấu trúc hình dạng tuỳ ý sử dụng thuật toán di truyền để
lựa chọn phân tử cấu trúc tối ưu cho các phép toán hình thái.
Trang 25 Tài liệu tham khảo
Tiếng Việt
1. Đỗ Năng Toàn, Ngô Quốc Tạo (1993), Kết hợp các phép toán hình thái học
và làm mảnh để nâng cao chất lượng ảnh đường nét. Tạp chí Tin học và
Điều khiển học, t.14, s.3, tr.23-29.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status