Các phép toán hình thái trong xử lý ảnh và xây dựng ứng dụng (2014) - Pdf 48

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
---------***---------

TẠ TIẾN THÀNH

CÁC PHÉP TOÁN HÌNH THÁI TRONG
XỬ LÝ ẢNH VÀ XÂY DỰNG ỨNG DỤNG

KHÓA LUẬN TỐT NGHIỆP
Chuyên ngành: Tin học

Ngƣời hƣớng dẫn khoa học
ThS. LƢU THỊ BÍCH HƢƠNG

HÀ NỘI, 2014


LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn sự hƣớng dẫn tận tình của cô
giáo ThS. Lƣu Thị Bích Hƣơng, khoa Công nghệ thông tin, trƣờng Đại học sƣ
phạm Hà Nội 2.
Em cũng xin chân thành cảm ơn các thầy, cô giáo trong khoa Công nghệ
thông tin, cũng nhƣ các thầy, cô giáo trong trƣờng đã giảng dạy và giúp đỡ
em trong các năm học vừa qua. Chính các thầy, cô giáo đã xây dựng cho
chúng em những kiến thức nền tảng và kiến thức chuyên môn để em có thể
hoàn thành khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình
sau này.
Cuối cùng em xin bày tỏ lòng biết ơn tới gia đình và bạn bè đã giúp đỡ
động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt
khóa luận này.

1.3. Các bƣớc cơ bản trong xử lý ảnh.......................................................... 6
1.4. Các định dạng ảnh cơ bản................................................................... 10
CHƢƠNG 2: CÁC PHÉP TOÁN HÌNH THÁI ................................................ 16
2.1. Thao tác trên ảnh nhị phân ................................................................. 16
2.1.1.

Phép dãn nhị phân (Dilation) ....................................................... 16

2.1.2.

Phép co nhị phân (Erosion) .......................................................... 21

2.1.3.

Phép mở nhị phân (Opening) ....................................................... 24

2.1.4.

Phép đóng nhị phân (Closing) ...................................................... 25

2.1.5.

Kĩ thuật đánh trúng và đánh trƣợt ................................................ 30

2.1.6.

Kĩ thuật đếm vùng ........................................................................ 32

2.2. Thao tác trên ảnh đa mức xám ........................................................... 33
2.2.1.

CHƢƠNG 4: XÂY D ỰNG CHƢƠNG TRÌNH ỨNG DỤNG ......... 54
4.1. Phát biểu bài toán ............................................................................... 54
4.2. Thiết kế chƣơng trình ......................................................................... 54
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .............................................. 63
1.

Kết luận............................................................................................... 63

2.

Hƣớng phát triển ................................................................................. 63

TÀI LIỆU THAM KHẢO .................................................................................. 65


CÁC KÝ HIỆU VIẾT TẮT
Viết tắt

Viết đầy đủ

Ý nghĩa
Biến đổi Karhumen Loeve

KL

Karhumen Loeve

CCIR

Consultative Committee for Tiêu chuẩn điều chế tần số CCIR

Định dạng ảnh TIFF

BMP

Windows bitmap

Định dạng ảnh BMP

DIB

Device Independent Bitmap

Một định dạng của ảnh bitmap

GIF

Graphics Interchanger Format

Định dạng ảnh GIF

LZW

Lempel Ziv Welch

Thuật toán nén LZW

JPEG

Joint



Ảnh định dạng TIFF

Mail Chuẩn Internet về định dạng cho
thƣ điện tử

Optical Character Recognition Hệ thống nhận dạng chữ viết bằng
thiết bị quang học OCR

AFIS

Automated
Identification System

fingerprint Hệ thống nhận dạng vân tay AFIS


DANH MỤC HÌNH VẼ
Hình 1.2: Các bƣớc cơ bản trong một hệ thống xử lý ảnh ................................ 5
Hình 1.3: Các bƣớc cơ bản trong xử lý ảnh ...................................................... 6
Hình 1.4: Sơ đồ phân tích và xử lý ảnh và lƣu đồ thông tin giữa các khối .... 10
Hình 1.5: Định dạng ảnh BMP........................................................................ 13
Hình 2.1: Thao tác nhị phân đơn giản trên một ảnh nhỏ. (a) Ảnh ban đầu; (b)
Ảnh dãn 1 điểm ảnh; (c) Ảnh dãn 2 điểm ảnh ................................................ 16
Hình 2.2: Dãn A bởi B. (a) Ảnh A, B ban đầu; (b) Ảnh A cộng phần tử (0,0);
(c) Tập A cộng phần tử (0,1); (d) Hợp của (b) và (c) hay kết quả phép dãn .. 18
Hình 2.4: Dãn ảnh sử dụng phần tử cấu trúc .................................................. 20
Hình 2.5: Phép co nhị phân ............................................................................. 22
Hình 2.6: Xoá hình thái những dòng ngang của khuông nhạc ....................... 24
Hình 2.7: Sử dụng phép toán mở .................................................................... 25

Hình 4.1: Form giao diện ................................................................................ 55
Hình 4.2: Kết quả phép giãn ảnh A ................................................................. 55
Hình 4.3: Kết quả phép co ảnh A .................................................................... 56
Hình 4.4: Kết quả phép mở ảnh A .................................................................. 56
Hình 4.5: Kết quả phép đóng ảnh A................................................................ 57
Hình 4.6: Kết quả nhận dạng biên ảnh A ........................................................ 57
Hình 4.8: Kết quả phép giãn ảnh B ................................................................. 58
Hình 4.9: Kết quả phép co ảnh B .................................................................... 58
Hình 4.10: Kết quả phép mở ảnh B................................................................. 59
Hình 4.11: Kết quả phép đóng ảnh B .............................................................. 59
Hình 4.12: Kết quả nhận dạng biên ảnh B ...................................................... 60
Hình 4.14: Kết quả phép co ảnh C .................................................................. 61
Hình 4.15: Kết quả phép mở ảnh C................................................................. 61


Hình 4.16: Kết quả phép đóng ảnh C .............................................................. 62
Hình 4.17: Kết quả nhận dạng biên ảnh C ...................................................... 62


MỞ ĐẦU
1. Lý do chọn đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhƣng tốc
độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng
dụng. Trong các trƣờng đại học, cao đẳng xử lý ảnh đã trở thành một môn
học chuyên ngành của sinh viên các ngành công nghệ thông tin, viễn
thông.
Xử lý nâng cao chất lƣợng ảnh là một vấn đề trọng tâm của môn học
xử lý ảnh đồng thời nó cũng là bƣớc tiền xử lý cho việc nhận dạng, trích
chọn thông tin trong xử lý ảnh số. Điều này cũng có ý nghĩa quan trọng

Đối tƣợng nghiên cứu của khóa luận là các phép toán hình thái trên ảnh
nhị phân và ảnh đa mức xám.
Phạm vi nghiên cứu: Nói đến các phép toán hình thái là nói đến một lĩnh
vực vô cùng rộng lớn và quan trọng trong xử lý ảnh. Trong khóa luận chỉ tìm
hiểu đến một phần của các phép toán hình thái. Đó là các phép toán hình thái
trên ảnh nhị phân và ảnh đa mức xám.
5. Ý nghĩa khoa học và thực tiễn
Khóa luận phân tích, làm rõ các phép toán hình thái. Từ đó ta có thể hiểu
thêm về tính chất, đặc điểm, ứng dụng của các phép toán hình thái. Nghiên
cứu góp phần chứng minh thêm tính đúng đắn của các phép toán hình thái.
Hiện nay các phép toán hình thái là một lĩnh vực đang đƣợc các chuyên gia
nghiên cứu và phát triển.
Xây dựng chƣơng trình thử nghiệm các phép toán hình thái nếu thành
công sẽ góp một phần nhỏ trong việc lựa chọn, chọn lọc ảnh số và trích chọn
biên ảnh.

2


6. Phƣơng pháp nghiên cứu
- Phƣơng pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết
các vấn đề của khóa luận.
- Phƣơng pháp chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chƣơng trình phù
hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng đƣợc yêu cầu ngày
càng cao của ngƣời sử dụng.
- Phƣơng pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận đƣợc

trọng trong tƣơng tác ngƣời máy.
Quá trình xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh tốt hơn
Ảnh

Xử lý ảnh
Kết luận
Hình 1.1: Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ
là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem nhƣ ảnh n chiều.

4


Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định

Tiền
xử lý

Thu
nhận
ảnh

Trích chọn


1.3. Các bƣớc cơ bản trong xử lý ảnh
Đầu tiên, ảnh tự nhiên từ thế giới ngoài đƣợc thu nhận qua các thiết bị
thu (nhƣ Camera, máy chụp ảnh). Trƣớc đây, ảnh thu qua Camera là các ảnh
tƣơng tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát triển của công
nghệ, ảnh màu hoặc đen trắng đƣợc lấy ra từ Camera, sau đó nó đƣợc chuyển
trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có
thể tiếp nhận từ vệ tinh, có thể quét từ ảnh chụp bằng máy quét ảnh. Hình 1.3
dƣới đây mô tả các bƣớc cơ bản trong xử lý ảnh:
Thu
nhận
ảnh

Tiền xử
lý ảnh

Phân
đoạn
ảnh

Biểu
diễn và
mô tả

Nhận
dạng và
nội suy

Cơ sở tri thức
Hình 1.3: Các bƣớc cơ bản trong xử lý ảnh

dụ: Trong nhận dạng ký tự trên phong bì thƣ, chúng ta miêu tả các đặc trƣng
của từng ký tự giúp phân biệt ký tự này với ký tự khác.
1.3.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thƣờng thu đƣợc
bằng cách so sánh với mẫu chuẩn đã đƣợc lƣu từ trƣớc. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Các mô hình toán học về ảnh đƣợc phân
theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số
- Nhận dạng theo cấu trúc
Một số đối tƣợng nhận dạng khá phổ biến hiện nay đang đƣợc áp dụng
trong khoa học và công nghệ là: Nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản, nhận dạng vân tay, nhận dạng mã vạch, nhận
dạng mặt ngƣời…

7


1.3.6. Cơ sở tri thức (Knowledge Base)
Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tối, dung
lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phƣơng pháp
toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt chƣớc quy trình
tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các bƣớc xử lý đó,
nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con ngƣời. Vì vậy,
ở đây các cơ sở tri thức đƣợc phát huy.
1.3.7. Mô tả (biểu diễn ảnh)
Ảnh sau khi số hoá sẽ đƣợc lƣu vào bộ nhớ, hoặc chuyển sang các khâu
tiếp theo để phân tích. Nếu lƣu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung
lƣợng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công
nghệ. Thông thƣờng, các ảnh thô đó đƣợc biểu diễn lại (hay đơn giản là mã

nhất (chứa toàn điểm đen “1” hay trắng “0”) thì gán cho vùng đó một mã và
không chia tiếp. Các vùng không đồng nhất đƣợc chia tiếp làm bốn phần theo
thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia
thành các vùng con tạo thành một cây phân chia các vùng đồng nhất.
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy
theo đặc điểm ứng dụng. Hình 1.4 cho sơ đồ phân tích và xử lý ảnh và lƣu đồ
thông tin giữa các khối một cách khá đầy đủ. Ảnh sau khi đƣợc số hóa đƣợc
nén, lƣu lại để truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo.
Mặt khác, ảnh sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lƣợng (khi
ảnh đủ chất lƣợng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn
hoặc bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng.
Hình 1.4 cũng chia các nhánh song song, nâng cao chất lƣợng ảnh có hai nhánh
phân biệt: Nâng cao chất lƣợng ảnh (tăng độ sáng, độ tƣơng phản, lọc nhiễu)
hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận đƣợc bị méo) …

9


Cảnh
quan

Nén
ảnh

Lƣu
ảnh

Truyền
ảnh

đoạn

Khôi phục
ảnh

Thu nhận ảnh

Mô tả
và nội
suy

Trích
chọn
quan
hệ

Hình 1.4: Sơ đồ phân tích và xử lý ảnh và lƣu đồ thông tin giữa các khối
1.4. Các định dạng ảnh cơ bản
1.4.1. Định dạng ảnh IMG
Ảnh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 byte chứa các
thông tin cần thiết:
+ 6 byte đầu: Dùng để đánh dấu định dạng ảnh IMG. Giá trị của 6 byte
này viết dới dạng Hexa: 0x0001 0x0008 0x0001.
+ 2 byte tiếp theo: Chứa độ dài mẫu tin. Đó là độ dài của dãy các byte
kề liền nhau mà dãy này sẽ đƣợc lặp lại một số lần nào đó. Số lần lặp này sẽ
đƣợc lƣu trong byte đếm. Nhiều dãy giống nhau đƣợc lƣu trong một byte.
+ 4 byte tiếp: Mô tả kích cỡ pixel
+ 2 byte tiếp: Số pixel trên một dòng ảnh
+ 2 byte cuối: Số dòng ảnh trong ảnh
Ảnh IMG đƣợc nén theo từng dòng. Mỗi dòng bao gồm các gói (pack).

nhƣ sau:
+ 1 byte: Chỉ ra kiểu định dạng. Nếu là kiểu PCX / PCC nó luôn có giá
trị là 0Ah.
+ 1 byte: Chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:
11


0: Version 2.5
2: Version 2.8 với bảng màu
3: Version 2.8 hay 3.0 không có bảng màu
5: Version 3.0 có bảng màu
+ 1 byte: Chỉ ra phƣơng pháp mã hoá. Nếu là 0 thì mã hoá theo phƣơng
pháp BYTE PACKED, nếu không là phƣơng pháp RLE.
+ 1 byte: Số bit cho một điểm ảnh plane
+ 1 word: Tọa độ góc trái trên của ảnh. Với kiểu PCX có giá trị là (0, 0),
còn PCC thì khác (0, 0).
+ 1 word: Tọa độ góc phải dƣới
+ 1 word: Kích thƣớc bề rộng và bề cao ảnh
+ 1 word: Số điểm ảnh
+ 1 word: Độ phân giải màn hình
+ 48 byte: Chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Nhƣ vậy ta có 16 thanh ghi màu.
+ 1 byte: Không dùng đến và luôn đặt là 0
+1 byte: Số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4,
với ảnh 256 màu (1 pixel / 8 bit) thì số bit plane lại là 1.
+ 1 byte: Số byte cho một dòng quét ảnh
+ 1 word: Kiểu bảng màu
+ 58 byte: Không dùng
Định dạng ảnh PCX thƣờng đƣợc dùng để lƣu trữ ảnh vì thao tác đơn
giản, cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định,

thƣớc ảnh nhỏ hơn ảnh gốc 2  3 lần, có trƣờng hợp có thể xấp xỉ ảnh gốc.
Tuy nhiên, với ảnh 256 màu thì nó bộc lộ rõ khả năng nén rất kém. Điều này
có thể lý giải nhƣ sau: Khi số màu tăng lên, các loạt dài xuất hiện ít hơn và vì
thế, lƣu trữ theo kiểu PCX không còn lợi nữa. Hơn nữa, nếu ta muốn lƣu trữ
nhiều đối tƣợng trên một tệp ảnh nhƣ kiểu định dạng TIFF, đòi hỏi có một
định dạng khác thích hợp.
Định dạng ảnh GIF do hãng ComputServer Incorporated (Mỹ) đề xuất
lần đầu tiên vào năm 1990. Với định dạng GIF, những vƣớng mắc mà các
định dạng khác gặp phải khi số màu trong ảnh tăng lên không còn nữa. Khi số
13


màu càng tăng thì ƣu thế của định dạng GIF càng nổi trội. Những ƣu thế này
có đƣợc là do GIF tiếp cận các thuật toán nén LZW (Lempel Ziv Welch). Bản
chất của kỹ thuật nén LZW là dựa vào sự lặp lại của một nhóm điểm chứ
không phải loạt dài giống nhau. Do vậy, dữ liệu càng lớn thì sự lặp lại càng
nhiều. Dạng ảnh GIF cho chất lƣợng cao, độ phân giải đồ họa cũng đạt cao,
cho phép hiển thị trên hầu hết các phần cứng đồ họa.
Do vậy, dữ liệu càng lớn thì sự lặp lại càng nhiều. Dạng ảnh GIF cho chất
lƣợng cao, độ phân giải đồ họa cũng đạt cao, cho phép hiển thị trên hầu hết
các phần cứng đồ họa.
Định dạng GIF có rất nhiều ƣu điểm và đã đƣợc công nhận là chuẩn để
lƣu trữ ảnh màu thực tế (chuẩn ISO 10918  1). Nó đƣợc mọi trình duyệt Web
(Web Browser) hỗ trợ với nhiều ứng dụng hiện đại. Cùng với nó có chuẩn
JPEG (Joint Photograph Expert Group). GIF dùng cho các ảnh đồ họa
(Graphic), còn JPEG dùng cho ảnh chụp (Photographic).

1.4.5. Định dạng ảnh JPEG
Phƣơng pháp nén ảnh JPEG (Joint Photographic - Experts Group) là một
trong những phƣơng pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần.

1: Biểu diễn đối tƣợng ảnh và đƣợc gọi là điểm đen
0: Biểu diễn nền ảnh (phông ảnh) và đƣợc gọi là điểm trắng
Đặc điểm:
+ Mỗi điểm ảnh đƣợc lƣu trữ bởi 1 bit nên dung lƣợng lƣu trữ rất nhỏ và
dễ dàng để xử lý.
+ Ảnh nhị phân thích hợp để biểu diễn đối tƣợng đƣờng nét nhiều nét,
chữ số.
+ Ảnh nhị phân phù hợp để biểu diễn các biên, vùng ảnh của ảnh số.
+ Tập tin của ảnh nhị phân là tập hợp các điểm đen.

(a)

(b)

(c)

Hình 2.1: Thao tác nhị phân đơn giản trên một ảnh nhỏ. (a) Ảnh ban đầu;
(b) Ảnh dãn 1 điểm ảnh; (c) Ảnh dãn 2 điểm ảnh
2.1.1. Phép dãn nhị phân (Dilation)
Phân tích một số thao tác tập hợp đơn giản nhằm mục đích định nghĩa
phép dãn nhị phân qua chúng. Phép dịch A bởi điểm x (hàng, cột) đƣợc định
nghĩa là một tập:
16



Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status