TRƯNG ĐI HC BCH KHOA H NI
VIỆN CÔNG NGHỆ THÔNG TIN V TRUYỀN THÔNG BO CO BI TẬP LỚN
Môn học: Xử lý ảnh
ĐỀ TÀI:
Tìm hiểu về các phép lọc số, khảo sát và xây dựng thử nghiệm
các ứng dụng của phép lọc trên miền tần số với xử lý ảnh màu.
Giáo viên hướng dẫn: PGS.TS. Nguyễn Thị Hoàng Lan
Sinh viên thực hiện:
Nguyễn Khánh Hưng 20081279 TTM-K53
Nguyễn Lê Hoài Nam 20081819 TTM-K53
Phan Văn Trường 20082846 TTM-K53 H Ni 4/2012
2
[email protected]
LI GIỚI THIỆU 4
I. KHÁI QUÁT VỀ ẢNH, ẢNH SỐ 5
II. TÌM HIỂU VỀ CÁC PHÉP LC SỐ 7
1. Khái quát về phép lọc ảnh 7
2. Các bộ lọc số 7
2.1. Định nghĩa và mô hình 7
2.2. Phân loại bộ lọc 8
2.3. Các bộ lọc thông dụng 9
4
[email protected]
LI GIỚI THIỆU
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa
học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất
nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên
dụng riêng cho nó. Xử lý ảnh là một quá trình liên tục. Đầu tiên là thu nhận ảnh từ
camera, vệ tinh hay các bộ cảm ứng,…Tiếp theo tín hiệu lấy vào sẽ được số hóa
thành tín hiệu số và chuyển qua giai đoạn xử lý, phân tích hay lưu trữ lại. Việc xử lý
ảnh chính là tăng cường ảnh, tức là làm cho ảnh trở nên đẹp hơn, tốt hơn và rõ hơn.
Có nhiều phương pháp cải thiện chất lượng ảnh nhưng ở đây chúng tôi chủ yếu tập
trung nghiên cứu về các phương pháp lọc ảnh. Tuy đã cố gắng hết sức nhưng bài
viết chắc chắn không thể tránh khỏi những sai sót. Vì vậy rất mong cô góp ý bổ
sung giúp chúng tôi hoàn thiện đề tài. Nhóm sinh viên:
Nguyễn Khánh Hưng
Nguyễn Lê Hoi Nam
Phan Văn Trường
5
[email protected]
I. KHÁI QUÁT VỀ ẢNH, ẢNH SỐ
Ảnh có thể được hiểu là thông tin (về đường nét, hình khối, màu sắc…) của
vật thể hay quang cảnh được chiếu sáng mà con người cảm nhận và quan sát được
bằng mắt và hệ thống thần kinh thị giác
Với ảnh màu: tùy thuộc vào số lượng màu, chất lượng màu mà ta cần 8, 16, 24
bits/pixel. Với hệ màu cơ bản RGB ta cần 3*8 = 24 bits/pixel.
Đến đây việc xử lý ảnh trở thành việc xử lý các phần tử của ma trận điểm ảnh.
6
[email protected]
Một bức ảnh số được biểu diễn bởi một ma trận điểm ảnh I[m,n], trong đó một
điểm ảnh được đặc trưng bởi tọa độ [m, n] và giá trị màu I. Như vậy, các phép xử lý
ảnh có thể tác động vào tọa độ của các điểm ảnh, làm thay đổi vị trí của các điểm
ảnh, hình khối trong ảnh, ta gọi đó là các phép xử lý về hình học. Bên cạnh tác động
vào tọa độ của các điểm ảnh, các phép xử lý ảnh cũng có tác động đến giá trị màu I
của các điểm ảnh, ta gọi đó là các phép xử lý về nội dung. Nhìn chung các phép xử
lý hình học không làm thay đổi nội dung của ảnh và được ứng dụng phổ biến trong
quá trình hiển thị hình ảnh. Các phép xử lý về nội dung tác động làm thay đổi các
thành phần về mặt giá trị màu của điểm ảnh, từ đó mang lại những hiệu quả về cảm
nhận khác nhau.
Các phép xử lý về nội dung được
biêu diễn thông qua mô hình như sau:
X[m, n] là ma trận điểm ảnh ban
đầu, sau quá trình xử lý dữ liệu F, ta
nhận được ma trận điểm ảnh Y[m, n]. Tùy thuộc vào F mà ta có ma trận kết quả
Y[m, n] khác nhau.
Việc xử lý ảnh màu cũng như xử lý ảnh đa mức xám. Với ảnh màu chúng ta
xử riêng 3 màu cơ bản R (đỏ), G (xanh lá), B (xanh lam): I
R
(x,y), I
G
(x,y) , I
B
(x,y). Hình 1: Ma trận lọc 3* 3
8
[email protected]
Ma trận bộ lọc còn được gọi là ma trận hạt nhân. Các ma trận hạt nhân có thể
có nhiều kích thước tùy ý, phổ biến nhất là ma trận 3*3 (hình 1), ngoài ra trong các
trường hợp cụ thể có thể sử dụng các bộ lọc 5*5 hay 7*7. Bộ lọc trong miền không
gian với ma trận hạt nhân khá trực quan và dễ thực hiện. Nó phù hợp với cảm quan
của chúng ta. Tuy nhiên cũng chính vì khá đơn giản nên nó không có được sự tinh
tế. Mặt nạ thường có các giá trị dương và đối xứng, nhưng không nhất thiết phải
như vậy. Nó có thể được chọn theo một phương pháp nào đó mà không thể trực
quan và một trong các phương pháp đó là lọc trên miền tần số .
Phương pháp lọc trên miền tần số đơn giản là thực hiện các phép biến đổi
ảnh trên miền tần số. Các tín hiệu đầu vào, đầu ra của ảnh, các bộ lọc đều được biến
về miền tần số.
Y(u, v) = X(u, v) * H(u, v)
Với Y(u, v) = DFT(Y(m, n));
X(u, v) * H(u, v) = DFT (X(m,n ) * H(k,l))
Bộ lọc trên miền tần số có 2 loại là bộ lọc thông thấp và thông cao. Bộ lọc
thông thấp thường được sử dụng để làm mờ ảnh, giảm nhiễu, bộ lọc thông cao thì
được sử dụng để làm sắc nét cạnh, biên làm cho ảnh rõ nét hơn. Thực ra bản chất
của phép lọc số đều sử dụng lọc tần số, chỉ là thực hiện trên miền không gian hay
miền tần số mà thôi.
2.2. Phân loại bộ lọc
Gồm có 2 loại:
- Bộ lọc đáp ứng xung hữu hạn (FIR)
9
[email protected]
Hình 2:Ma trận đầu vo
Trên hình 2, giá trị pixel trung tâm không đại diện cho các điểm xung quanh
nó, vì vậy ta sẽ thay thế bằng giá trị trung bình của các điểm lân cận:
Điểm lân cận: 124, 126, 127, 125, 123, 119, 115, 120, 150
Giá trị trung bình:
= 125
Như vậy giá trị 150 sẽ được thay thế bởi giá trị trung bình 125. Ở đây sử dụng
cửa sổ 3 x 3. Nếu dùng cửa sổ lớn hơn sẽ tạo ảnh có độ mịn hơn.
2.3.2. Lọc thông thấp
Lọc thông thấp thường được sử dụng để làm trơn nhiễu.
Với kỹ thuật lọc trên miền không gian người ta hay dùng một số mặt nạ lọc có
dạng sau: Ta dễ dàng nhận thấy khi b = 1, H
b
chính là mặt nạ lọc H
t1
(lọc trung bình).
Để hiểu rõ hơn bản chất khử nhiễu cộng của bộ lọc này, ta viết lại phương trình thu
nhận ảnh dưới dạng:
12
[email protected]
III. KHẢO ST V XÂY DỰNG THỬ NGHIỆM CC ỨNG DỤNG CỦA
PHÉP LC TRÊN MIỀN TẦN SỐ.
1. Cơ sở lý thuyết
1.1. Hạn chế của xử lý ảnh trên miền không gian
Phần trên chúng ta đã nêu những ứng dụng của phương pháp lọc trên miền
không gian. Biện pháp xử lý ảnh trên miền không gian là khá trực quan.Trên miền
không gian, độ xám tại một pixel trong ảnh mới bằng một biểu thức tuyến tính giữa
độ xám của các pixel kế cận trong ảnh cũ. Như vậy, để làm các chi tiết trên ảnh trơn
hơn, ta có thể tính độ xám tại pixel (x,y) trên ảnh mới bằng trung bình cộng độ xám
của chính nó và 8 pixel lân cận trong ảnh cũ.
(1.1)
Nếu muốn làm các chi tiết trên ảnh nối bật hơn, ta có thể tính độ xám tại pixel
(x, y) trên ảnh mới bằng một trung bình có trọng số độ xám của chính nó và 8 pixel
(1.2)
Nói tóm lại, xử lý ảnh trên miền không gian là một phương pháp rất trực
quan, phù hợp với cảm giác tự nhiên của chúng ta: nhìn vào các biểu thức (1.1) và
(1.2), ta cũng hình dung được phần nào về ảnh kết quả.
Tuy nhiên, cũng chính do tính đơn giản như trên mà phương pháp xử lý ảnh
trên mà phương pháp xử lý trên miền không gian là không được tinh tế. Chẳng hạn
hệ số của mặt nạ (filter mask) thường được chọn là dương.
Dĩ nhiên, trong một số trường hợp, mặt nạ có thể chứa các hệ số âm. Một thí
dụ khác là các mặt nạ thường là ma trận đối xứng. Hiển nhiên ta thấy rằng mặt nạ
không nhất thiết phải là ma trận đối xứng. Hơn nữa, các hệ số của mặt nạ cũng
không nhất thiết nguyên hay hữu tỷ. Đối với các trường hợp như vậy, các hệ số phải
được chọn bằng một phương pháp nào đó, chứ không còn bằng trực quan như trước
đây.
13
[email protected]
Phương pháp xử lý ảnh trên miền tần số là một trong số đó. Sự can thiệp sâu
sắc của toán học cho ta những đối tượng, những đại lượng ẩn dưới lớp vỏ trực quan
của ảnh. Do đó, nếu chỉ đơn thuần quan sát, phân tích ảnh bằng thị giác thì ta không
14
[email protected]
Biến đổi ngược của F(u) cho f(x) được định nghĩa: Không gian hai chiều
Cho f(x,y) hàm biểu diễn ảnh liên tục trong không gian 2 chiều, cặp biến đổi
Fourier cho f(x,y) được định nghĩa:
- Biến đổi thuận u, v biểu diễn tần số
- Biến đổi ngược
1.3. Phép biến đổi Fourier rời rạc - DFT
Ý tưởng của việc áp dụng khai triển Fourier nằm ở chỗ ta muốn phân tích một
hàm hai biến f = f(x, y) bất kì thành tổng của vô hạn các sóng dạng sin hay cos. Tuy
nhiên, không nhất thiết chỉ có khai triển Fourier mới cho ta một cách phân tích như
vậy. Hơn nữa, trường độ xám f mà ta đang xét là hàm bậc thang, tức là có hữu hạn
giá trị nên f hoàn toàn có thể được phân tích thành sóng một cách đơn giản hơn. Ta
bắt đầu xét cách phân tích “đơn giản hơn” này dưới dạng một chiều để thấy rõ ý
tưởng.
Gọi g là một hàm có miền xác định rời rạc như sau
g: {0,1,….,M – 1}R
Khi đó hàm G:{0,1, ,M – 1}C xác định bởi
Công thức (1.3) và (1.4) cho thấy sự tương ứng 1 – 1 giữa một hàm rời rạc
và DFT của nó. Khi biết g ta có thể tìm được G và ngược lại. Tuy nhiên, điều đặc
biệt lại nằm ở công thức (1.4). Ta biết rằng:
Nên (1.4) được viết lại như sau:
Hay
16
[email protected]
Rõ ràng (1.6) là một sự phân tích hàm g thành tổng của các sóng sin hay cos.
Chú ý rằng tổng ở đây là tổng hữu han, chứ không phải tổng vô hạn (chuỗi) như
khai triển Fourier mà ta đã xét ở mục trước.
Mỗi sóng thành phần là
Vì
Do đó (1.6) được viết lại như sau
17
[email protected]
. Ở (1.3),
ta có
, tức là tổng của g. Ta sẽ chứng mình rằng
Điều cần chứng minh tương đương với
Với
,
Khai triển 2 vế của (1.10) ta có được bất đẳng thức tương đương:
Áp dụng bất đẳng thức Bunhyakovski-Cauchy-Schwarz, ta có
Mà
Theo (1.8), thay u bởi M - u, ta được
Do đó, với mọi , ta có
Vì vậy nên
với
.
Do đó, ta cũng có thể chấp nhận rằng các sóng
chỉ
đóng vai trò là nhiễu khi u khá gần
.
Trên đây ta vừa đưa ra một cách biểu diễn sóng cho hàm một biến g. Ở đó,
một số sóng đóng góp lớn vào giá trị tổng của G ( khi u gần 0 hoặc gần M), trong
khi một số sóng khác chỉ đóng vai trò nhiễu (khi u gần
với u = 0,1,…,M-1 , v = 0,1,…,N-1.
Tương tự như trường hợp một chiều, ta cũng có thể tìm lại f nếu biết DFT của
nó bằng công thức
Do f là giá trị thực nên phần ảo của vế phải bằng 0. Ta có
20
Ta có
Do đó
Từ (1.14) suy ra
Từ (1.15) suy ra
21
[email protected]
Do đó
Từ (1.11) ta có
Tức F(0,0) là giá trị tổng của f. Ta chứng minh được rằng
Như vậy,
đạt giá trị lớn nhất tại (0, 0). Điều đó có nghĩa là trong các
càng nhỏ khi (u, v) càng gần
. Do đó, các
song ứng với (u, v) gần
có biên độ nhỏ (và do đó chỉ đóng vai trò nhiễu), còn
các sóng ứng với (u, v) gần (0, 0), hay (M, 0), hay (0, N), hay (M, N) thì có biên độ
lớn. Tiếp theo, ta xét khả năng vận dụng biến đổi DFT hai chiều ở (1.11) và (1.12)
vào việc xử lý ảnh. Hàm f giờ đây là trường độ xám, trong đó f(x, y) là độ xám của
ảnh tại pixel có tọa độ là (x, y).
Giả sử ta muốn là trơn ảnh, tức là làm trơn hàm f. Công thức (1.14) gợi ý rằng
kết quả ảnh g sẽ có dạng
Trong đó H(u,v) khá nhỏ khi (u, v) gần
để làm giảm biên độ của các
nhiễu này. Ở đây, từ giảm có thể hiểu theo nghĩa H(u,v) = 1 khi (u, v) khá gần(0, 0),
hoặc (M, 0), hoặc (0, N), hoặc (M, N), còn khi (u, v) khá gần
. Để tiện cho việc tính toán sau này, ta dùng phép biến đổi sau
Thật vậy,
Sự biến đổi này chỉ là sự dời điểm sáng nhất trên
từ (0,0) sang
mà thôi.( Hình 5)
Hình 5: Trước khi dời trục v sau khi dời trục
Ảnh thu được ở (1.19) là ảnh kết hợp của ảnh đã được đổi biến. Do đó, ảnh
kết quả ứng với f là g phải thỏa mãn:
thì (1.19) được viết lại thành:
Nếu gọi
là phần thực của DFT ngược của G thì áp dụng (1.14) với , ta có
24
[email protected]
Nên với giả thiết h(u,v) thực, ta có
Do đó, nếu
thì
So sánh với (1.20) ta suy ra
. Điều đó có nghĩa là ở (1.19)
chính là phần thực của biến đổi DFT ngược của
4.Tính
.
5.Tìm , là phần thực của biến đổi DFT ngược của G.
6.Ảnh kết quả