B ộ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC s ư PHẠM HÀ NỘI 2
===íoH cs===
LÊ TRUNG THỨC
NGHIÊN CỨU PHƯƠNG PHÁP LỌC NHIỄU ẢNH
VÀ ỨNG DỤNG CHO ẢNH TÀI LIỆU
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01
LUẬN VĂN THẠC s ĩ MẤY TÍNH
Người hướng dẫn khoa học: PGS. TS. NGÔ QUỐC TẠO
HÀ NỘI, 2015
1
LỜI CẢM ƠN
Trong thời gian thực hiện luận văn thạc sỹ em đã nhận được rất nhiều
sự khích lệ, động viên, giúp đỡ từ phía thầy cô, cha mẹ và bạn bè xung quanh.
Em xin gửi lời cảm on chân thành tới các thầy cô trong trường Đại học
Sư phạm Hà Nội 2, các thầy ở Viện Công nghệ thông tin đã truyền đạt vốn
kiến thức quý báu cho chúng em.
Em xin bày tỏ lòng biết ơn chân thành nhất tới thầy giáo, PGS.TS Ngô
Quốc Tạo, người đã trực tiếp hướng dẫn em hoàn thành luận văn thạc sỹ này.
Cảm ơn đề tài: " Hệ thống đeo tay hỗ trợ đọc sách tiếng Việt dành cho
người khiếm thị” Mã số VAST01.07/15-16 hỗ trợ trong thực hiện luận văn.
CHƯƠNG I - KHÁI QUÁT VỀ x ử LÝ ẢNH VÀ LỌC NHIỄU Ả N H ...... 9
1.1 Giới thiệu về xử lý ảnh......................................................................... 9
1.2 Những vấn đề cơ bản trong hệ thống xử lý ảnh................................. 10
1.2.1 Những khái niệm cơ bản........................................................... 10
1.2.1.1 Điểm ảnh (Picture Element).............................................. 10
1.2.1.2 Độ phân giải của ảnh...........................................................10
1.2.1.3 Mức xám của ảnh............................................................... 11
1.2.1.4 Ảnh số..................................................................................12
1.2.1.5 Quan hệ giữa các điểm ảnh................................................ 12
1.2.2 Thu nhận ảnh...............................................................................14
1.2.3 Tiền xử lý (Image Processing)....................................................15
1.2.4 Những vấn đề khác trong xử lý ảnh.......................................... 16
1.2.4.1 Biến đổi ảnh (Image Transform)........................................ 16
1.2.4.2 Nén ảnh................................................................................16
1.2.4.3 Các định dạng cơ bản trong xử lý ảnh............................... 16
1.3 Bài toán lọc nhiễu ảnh..........................................................................17
1.3.1 Bài toán.......................................................................................17
1.3.2 Giới thiệu về nhiễu ảnh...............................................................18
1.3.2.1 Một mô hình của quá trình suy thoái................................. 18
1.3.2.2 Nhiễu....................................................................................19
1.3.3 Khái niệm lọc nhiễu ảnh............................................................ 24
CHƯƠNG 2 - CÁC KỸ THUẬT LỌC NHIỄU Ả N H ................................. 26
2.1 Kỹ thuật lọc trung bình....................................................................... 26
2.2 Kỹ thuật lọc thích nghi........................................................................ 28
2.3 Kỹ thuật lọc cấp độ thấp..................................................................... 29
4
2.4 Kỹ thuật lọc theo thứ tự ..................................................................... 30
20
Hình 1.4 Nhiễu Gauss
21
Hình 1.5 Nhiễu đốm
22
Hình 1.6 Tài liệu bị hỏng bởi nhiễu chu kì
24
Hình 2.1 Xóa muổi-hạt tiêu với hàm medỷìlt
28
Hình 2.2 Lẩy trung bình 3*3
30
Hình 2.3 Lấy trung bình 5*5
30
Hình 2.4 Lọc nghịch đảo
32
50
Hình 3.6 Lọc trung bình mặt nạ 3x3 loại bỏ nhiễu Gauss
50
Hình 3.7 Lọc trung bình mặt nạ 5x5 loại bỏ nhiễu Gauss
51
Hình 3.8 Lọc tương thích mặt nạ 5x5 loại bỏ nhiễu Gauss
51
Hình 3.9 Lọc tương thích mặt nạ 7x7 loại bỏ nhiễu Gauss
51
Hình 3.10 Lọc tương thích mặt nạ 9x9 loại bỏ nhiễu Gauss
52
Hình 3.11Ảnh sau khi làm hư hại muối - tiêu
52
Hình 3.12 Lọc trung bình loại bỏ nhiễu muối - tiêu
52
tránh khỏi nhiễu hoặc khuyết thiếu. Sự sai sót này một phần bởi các thiết bị
quang học và điện tử, phần khác bởi bản thân các phép biến đổi không phải là
toàn ánh, nên có sự ánh xạ thiếu hụt đến những điểm trên ảnh kết quả.Việc
khắc phục các nhược điểm này luôn là vấn đề đặt ra cho các hệ thống xử lý
ảnh.
Các hệ xử lý ảnh trong quá trình phân tích ảnh, tăng cường ảnh để nâng
cao chất lượng ảnh. Do các nguyên nhân khác nhau có thể do chất lượng thiết
bị thu nhận ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến, do vậy
cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính
của ảnh, hay làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái trước
khi ảnh bị biến dạng
Xuất phát trong hoàn cảnh đó “Nghiên cứu phương pháp lọc nhiễu ảnh
và ứng dụng cho ảnh tài ỉiệứ'’ được em chọn làm đề tài.
2. Mục đích nghiên cứu
Mục đích chính của đề tài là:
- Nghiên cứu về nhiễu ảnh, một số phương pháp lọc nhiễu ảnh
7
- Sử dụng một ngôn ngữ để triển khai xây dựng chương trình mô phỏng
một số phương pháp lọc nhiễu ảnh
3. Nhiệm vụ nghiên cứu
Tìm hiểu khái quát về xử lý ảnh
Tìm hiểu các phương pháp lọc nhiễu ảnh
Chọn ra phương pháp lọc họp lý cho ảnh cụ thể.
Xây dựng chương trình ứng dụng lọc nhiễu cho ảnh phong cảnh, ảnh
tài liệu...
4. Đối tượng và phạm vi nghiên cứu
Đối tượng:
2.5 Kỹ thuật lọc nghịch đảo
2.6 Kỹ thuật lọc Band Reject
2.7 Sử dụng bộ lọc Notch
2.8 Lựu chọn công cụ, ngôn ngữ lập trình
Chương 3: Bài toán lọc nhiễu cho ảnh tài liệu
3.1 Bài toán
3.2 Thử nghiệm chương trình lọc nhiễu muối tiêu và Gauss
3.3 Chương trình lọc nhiễu ảnh
3.4 Kết quả thử nghiệm chương trình lọc nhiễu ảnh
9
CHƯƠNG I - KHÁI QUÁT VÈ x ử LÝ ẢNH VÀ LỌC NHIỄU ẢNH
1.1 Giới thiệu về xử ỉý ảnh
Xử lý ảnh là một lĩnh vực đang được quan tâm nghiên cứu và có nhiều
ứng dụng quan trọng trong thực tế cùng với sự phát triển của công nghệ thông
tin, thúc đẩy các ngành kinh tế, xã hội khác phát triển. Mục đích chính của xử
lý ảnh có thể nêu ra như sau:
•
Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác
định (Ví dụ như ảnh mờ, cần xử lý để được ảnh rõ hơn).
•
Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc
1.2 Những vấn đề cơ bản trong hệ thống xử ỉý ảnh
1.2.1 Những khái niệm cơ bản
1.2.1.1 Điếm ảnh (Picture Element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng.
Để xử lý bằng máy tính (số), ảnh cần phải được số hóa. số hóa ảnh là sự biến
đổi gần đúng một ảnh liên tục thành một tập điểm phù họp với ảnh thật về vị
trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó
được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng.
Mỗi một điểm như vậy được gọi là điểm ảnh (PEL: Picture Element) hay gọi
tắt là Pixel. Trong khuân khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ
(x,y).
Định nghĩa:
Điểm ảnh (Pixel) là một phần tử của ảnh số tại tọa độ (x,y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật.Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
1.2.1.2 Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh
đươc ấn đinh trên ảnh số đươc hiển thi.
11
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách
thích họp tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân
bố theo trục Xvà y trong không gian hai chiều..
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Grraphic
1.2.1.4 Ảnh số
Định nghĩa: Ảnh số là tập họp các điểm ảnh với mức xám phù họp
dùng để mô tả ảnh gần với ảnh thật.
1.2.1.5 Quan hệ giữa các điếm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x,y). Tập con các điểm
ảnh là S; cặp điểm ảnh có quan hệ với nhau là p,q. Đe thể hiện quan hệ giữa
các điểm ảnh chúng ta có một số khái niệm sau:
a) Các lân cận của điểm ảnh (Image Neighbors)
Giả sử có điểm ảnh p tại tọa độ (x,y). p có 4 điểm lân cận gần nhất theo
chiều đứng và ngang (có thể coi lân cận 4 hướng chính : Đông, Tây, Nam,
Bắc).
{(x-l,y);(x,y-l);(x,y+l);(x+l,y)Ị = N4(p)
Trong đó: số 1 là giá trị logic; N4(p) là 4 điểm lân cận của p
■ 4---------------------------------------------------------------------- ►
Đông
Nam . i
y
Bắc , r
Tây
X
(x-Ly-1)
(X, y-l)
(x+Ịy-1)
Có 3 loại liên kết.
Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá
trị cường độ sáng V nếu q nằm trong một các lân cận của p, tức q thuộc N4(p)
Liên kết 8: Hai điểm ảnh nằm trong một các lân cận 8 của p, tức
q thuộc Ng(p)
Liên kết m (liên kết hỗn họp): Hai điểm ảnh p và q với các giá trị
cường độ sáng V được nói là liên kết m nếu.
1.q thuộc N4(p ) hoặc
2.q thuộc Np(p)
c) Đo khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (x,y), q
tọa độ (s,t) là hàm khoảng cách (Distance) hoặc Metric nếu:
1. D(p,q) > 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)
2. D(p,q) = D(q,p)
3. D(p,z) q) = lx-sl + ly-tl
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm
ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12”
(12”*2,54cm = 30,48cm = 304,8mm) độ phân giải 320*200; tỷ lên 4/3 (chiều
dài/chiều rộng). Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ
lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài
ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể
khử nhiễu hệ thống bằng việc sử dụng phép biến đổi Fourie và loại bỏ các
đỉnh điểm. Đối với nhiễu ngẫu nhiên, trường họp đơn giản là các vết bẩn
tương ứng với các điểm sáng hay tối thì có thể khử bằng phương pháp nội
suy, lọc trung vị và lọc trung bình.
Chỉnh độ tương phản: Công việc cụ thể là chỉnh sửa tính không đồng
đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh.
Nâng cao chất lượng ảnh: Nâng cao chất lượng ảnh nhằm hoàn thiện
một số đặc tính của ảnh như:
- Lọc nhiễu hay làm trơn ảnh
- Tăng độ tương phản, điều chỉnh mức xám của ảnh
- Làm nổi biên ảnh
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên
các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép
biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân
cận khác trong khi đó toán tử không gian sử dụng các điểm lân cận để quy
chiếu đến điểm đang xét, một số phép biến đổi có tính toán phức tạp được
chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại
miền không gian nhờ các biến đổi ngược
16
1.2.4 Những vẩn đề khác trong x ử lý ảnh
1.2.4.1 Biến đổi ảnh (Image Transform)
Trong xử lý ảnh, do số điểm ảnh lớn, các tính toán nhiều (độ phức tạp
tính toán cao) đòi hỏi dung lượng bộ nhớ lớn, thời gian tính toán lâu.Các
phương pháp khoa học kinh điển áp dụng cho xử lý ảnh hầu hết khó khả thi.
Vì vậy, chúng ta sử dụng các phép toán tương đương hoặc biến đổi ảnh sang
Ảnh PCX: Là một trong những định dạng ảnh cổ điển
nhất. Nó sử dụng phương pháp mã loạt dài RLE (Run Length
Encoded) để nén dữ liệu ảnh. Quá trình nén và giải nén được thực
hiện trên từng dòng ảnh.
■
Ảnh TIFF: Là ảnh mà dữ liệu chứa trong tệp thường được
tổ chức thành các nhóm dòng (cột) quét của dữ liệu ảnh.
■
Ảnh GIF: Dạng ảnh GIF cho chất lượng cao, độ phân giải
đồ họa cao và cho phép hiển thị trên hầu hết các phần cứng.
Tuy các định dạng này khác nhau, song chúng đều tuân theo một cấu
trúc chung nhất là gồm 3 phần:
■
Dữ liệu nén (Data Compression): số liệu ảnh được mã hóa
bởi kiểu mã hóa chỉ ra trong phần Header.
■
Bảng màu (Palette Color): Bảng màu cho biết số màu dùng
trong ảnh và sử dụng trong việc hiển thị màu của ảnh. Ảnh đen trắng
không nhất thiết phải có bảng màu.
1.3 Bài toán lọc nhiễu ảnh
1.3.1 Bài toán
F (i,j) = ( G ( i , j ) - N ( i , j ) ) / H ( i , j )
Tuy nhiên như chúng ta đã biết đây là phương pháp phi thực tiễn. Mặc
dù chúng ta đa biết một số thông tin thống kê và sự nhiễu nhưng chúng ta
không biết các giá trị của r|(i, j) hoặc N(i, j) và bất kì giá trị nào khác. Mặt
khác sự chia nhỏ H(i, j) là một trở ngại lớn khi xuất hiện các giá trị gần bằng,
ngang bằng hoặc bằng 0.
19
1.3.2.2 Nhiễu
Chúng ta có thể xác định được bất kỳ sự suy thoái trong các tín hiệu
hình ảnh gây ra bởi sự xáo trộn bên ngoài. Nếu một hình ảnh được gửi điện tử
từ một nơi này tới nơi khác, thông qua truyền dẫn vệ tinh hoặc không dây,
hoặc thông qua cáp nối mạng, các sai sót trong các tín hiệu hình ảnh là không
tránh khỏi. Những lỗi này sẽ xuất hiện trên đầu ra hình ảnh theo nhiều cách
khác nhau tùy thuộc vào loại xáo trộn trong tín hiệu. Thông thường chúng ta
cần biết những loại nhiễu trên hình ảnh để chúng ta có thể lựa chọn phương
pháp thích họp nhất để giảm các tác động. Khôi phục hình ảnh bị nhiễu là một
mảng quan trọng của phục hồi hình ảnh. Trong chương này, chúng ta sẽ điều
tra một số trong các hình thức nhiễu tiêu chuẩn, và các phương pháp loại bỏ
hoặc giảm thiểu các tác động của chúng trên hình ảnh.
a) Nhiễu muối, hạt tiêu
Nhiễu Muối, hạt tiêu còn được gọi là xung nhiễu, nhiễu ngắn hoặc
nhiễu nhị phân. Suy thoái này có thể được gây ra bởi độ tương phản/phân giải
ảnh, các rối loạn đột ngột trong các tín hiệu hình ảnh gây ra sự xuất hiện ngẫu
nhiên, rải rác các điểm ảnh màu trắng hoặc đen (hoặc cả hai) trên hình ảnh[l],
[ 2].
Đe chứng minh sự xuất hiện của nó, chúng ta sẽ rẽ tạo ra một hình ảnh
technology for integrated circuits
implementation. Therefore, some of
CM OS multipliers
Hình 1. 2 Ảnh gốc
multiplier are important nonlinear
analog signal processing function
finding application of a wide variety
in adaptive filtering, modulation, //V:
frequency translation, automatic
gain controlling, neural network,
etc. At present, the power
consumption Is a key parameter in
the designing of high performance
mixed-signal integrated circuit. As
CMOS technology is widely
recognized as the most deẹiráblẹ
technology for integrated circuits
implementation. Therefore, some of
CMOS multipliers
Hình 1. 3 Thêm nhiễu muối, tiêu
21
b) Nhiễu Gauss
Nhiễu Gauss là một hình thức lý tưởng hoá của nhiễu trắng, bị gây ra
bởi sự biến động ngẫu nhiên trong tín hiệu. Chúng ta có thể quan sát nhiễu
trắng bằng cách xem truyền hình mà hơi sai /không điều chỉnh trên từng kênh
22
c) Nhiễu đếm
Trong khi nhỉễu Gauss có thể được mô hình hóa bởi các giá trị ngẫu
nhiên được thêm vào một hình ảnh; đốm nhiễu (hoặc chỉ đơn giản là đốm trên
ảnh) có thể được mô hình hóa bởỉ các gỉá trị nhân ngẫu nhiên vổd gỉá trị pixel,
do đó nó là cũng được gọi là nhân giống nhiễu [6]. Chẩm nhiễu là một vấn đề
lớn trong một sổ ứng dụng radar. Hàm ỉmnoise có thể tạo đốm trên ảnh:
» t_spk=imnoise (t, ’speckle');
và kết quả được thể hiện trong hinh 1.5
multiplier are important nonlinear
analog signal processing function
finding application of a wide variety
in adaptive filtering, modulation,
frequency translation, automatic
gain controlling, neural network,
etc. At present, the power
consumption is a key parameter in
the designing of high performance
mixed-signal integrated c irc u it As
CMOS technology is widely
recognized as the most desirable
technology for integrated circuits
Implementation. Therefore, some of
CMOS multipliers
Hình 1.5 Nhiễu đốm
Trong MATLAB , nhiễu đốm được thực hiện như I = (1+N); trong đó I
bằng cách thêm vào một ma trận định kỳ (bằng cách sử dụng một hàm lượng
giác), hình ảnh của ở đây được biểu diễn bằng [7], [8], [9]:
s=size (t);
[x, y]=meshgrid (1 : s (1), 1 : s (2) );
p=sin (x/3+y/5) +1;
t_pn= (im2double (t) +p/2) /2;
24
và hình ảnh kết quả được hiển thị trong hình:
xn ultiplíẹr are impợrtbnt Uữplĩpẻạr J
ặnạíog si^nạ l prpceịsiiig iunctỉon
;tìiídmỊí;ạ^piip^Ị.o^ộí;^/Ãi^è/vặlrj^Ịỹ;-;í
Ịh. ád a p £ f u & i n g, mqđq Ịatí0ri,
í
-ÌTécpénờy írahs.ỉati QCỊỵ aiitomatìc; • ■
' ^ m :c ọ n ^ Ịỉin q .'n ộ ộ ra ^ )ẹ tw o fk r .^.;':.v
'Ô;tC.;;'Ãt:pr0SèjÌ^thệ;ppW6r''
'Ệ'
consum ptỉọĩĩ ỉẩ a ^ey-.parạniSter';ỉn ■
fhe; đteigniiig of high pertóímancp
'nrỉxạd-sígnại; liìteổratéđ c iĩe u ít As