Chương
1
Giới thiệu về xử lý ảnh
1.1 Giới thiệu
Cuốn sách này cung cấp cho các bạn những lý thuyết cơ bản và các phương
pháp thông dụng trong lĩnh vực xử lý ảnh. Trong chương 1, chúng tôi sẽ giới thiệu
với bạn một vài khái niệm và thuật ngữ cần thiết. Chúng tôi cũng giới thiệu sơ
lược các kiến thức tổng quát và các thiết bị cần thiết cho một hệ thống xử lý ảnh.
Cuối cùng là phần giới thiệu chung về nội dung của các chương trong cuốn sách.
1.2 Chuẩn bị cơ bản
Xử lý ảnh có quan hệ mật thiết với nhận thức về ảnh của con người. Nói một
cách khác, “thị giác máy" dựa trên phép xử lý ảnh bằng sự phân tích của máy.
Theo một số tác giả, hai lĩnh vực: xử lý ảnh số và “thị giác máy" được liên kết
chặt chẽ với nhau. Tuy nhiên, đến nay, cả hai lĩnh vực này đã hoàn thiện đến mức
chúng có thể cho phép giải quyết mỗi vấn đề một cách riêng rẽ. Trong cuốn sách
này, chúng tôi sẽ trình bày về lĩnh vực xử lý ảnh số, phát triển các thuật toán và
cung cấp những ví dụ cụ thể. Lĩnh vực về “thị giác máy" sẽ được trình bày trong
một cuốn sách khác. Xử lý ảnh số có rất nhiều ứng dụng như làm nổi các ảnh
trong y học, khôi phục lại ảnh do tác động của khí quyển trong thiên văn học, tăng
cường độ phân giải của ảnh truyền hình mà không cần thay đổi cấu trúc bên trong
của hệ thống chuyển tải, nén ảnh trong khi truyền đi xa hoặc lưu trữ. Vấn đề này
được trình bày một cách chặt chẽ trên quan điểm xử lý tín hiệu hai chiều. Cuốn
sách này được chia làm 17 chương. Mỗi một chương đều đề cập đến một vấn đề
cơ bản khác nhau và phục vụ cho các chương tiếp theo. Để hiểu tường tận, bạn
phải đọc các chương theo đúng thứ tự mà nó được trình bày. Để hiểu đầy đủ thì
yêu cầu phải chuẩn bị một số kiến thức cơ sở. Hiện nay, ngôn ngữ lập trình C
được sử dụng phổ biến trong các bài toán kỹ thuật. Vì vậy, tôi chọn C làm ngôn
ngữ cho các chương trình nguồn của tất cả các thuật toán. Bạn cần phải có một số
kiến thức cơ bản về C để hiểu các chương trình này. Bạn có thể nghiên cứu C khi
làm việc với cuốn sách này. Nó sẽ giúp bạn có các kỹ năng thực tế và đồng thời
này được chia thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn cho cường độ
sáng của một trong các màu chính. Để hiểu việc số hoá ảnh hãy xem hình 1.1. Hình 1.1 Biểu diễn của một mức xám của ảnh số.
Độ sáng trung bình trong m
ỗi
hình chữ nhật = giá trị một
điểm ảnh.
Pixel
or PEL
Trong hình này một lưới chia ô vuông tưởng tượng được đặt lên ảnh. Độ lớn
mỗi ô vuông của lưới xác định kích thước của một điểm ảnh. Mức xám của một
điểm được tính bằng cường độ sáng trung bình tại mỗi ô vuông này. Mắt lưới càng
nhỏ thì cho chất lượng ảnh càng cao. Trong kỹ thuật truyền hình tiên tiến, mục
đích là cung cấp cho người xem, hình ảnh chất lượng cao, với độ phân giải gấp hai
lần so với các chuẩn hiện nay.
n=0
x(t,0)xung
đồng
bộ.
n=1
x(t,T)xung
đồng
bộ.
t=0
t=0
cụng nghip. Thc t ch ra rng bt k ng dng no trờn nh mc xỏm cng ng
dng c trờn nh mu. Vỡ lý do ny tụi ngh h thng ca bn ban u ch
bao gm cỏc thit b thu nhn v hin th nh en trng. Trong chng 11 chỳng ta
s cp n lnh vc x lý nh mu. Vi nh mu, tụi ngh bn s dng mt
h thng mi ging nh hỡnh 1.3, ngoi tr bn cn mt camera TV mu v mt
monitor a tn s (vớ d nh NEC multiSync, Sony multiscan, hoc Mitsubishi
Diamond Scan ) hin th nh mu. Nu kh nng ti chớnh ca bn khụng cho
phộp, bn cú th vn dựng PC ca bn kốm theo v mch VGA v monitor VGA,
v dựng nh c cho trong cun sỏch ny.
Hỡnh 1.3 Mt h thng x lý nh.
Bõy gi chỳng ta cp n tt c cỏc khi trong h thng.
Máy tính cá nhân
Màn
hình
video
Màn hình
trên cùng một màn hình hoặc hai màn hình riêng biệt. Mặc dù chi tiết này là
không cần thiết, nhưng nó sẽ rất có giá trị trong trường hợp bạn bị giới hạn
về không gian lắp đặt hoặc khả năng tài chính.
Camera. Tổng quát có hai kiểu camera: kiểu camera dùng đèn chân không và
kiểu camera chỉ dùng bán dẫn. Đặc biệt là trong lĩnh vực này, camera bán dẫn
thường hay được dùng hơn camera đèn chân không. Camera bán dẫn còn được gọi
là CCD camera do nó dùng các thanh ghi dịch đặc biệt gọi là thiết bị ghép (charge-
coupled devices- CCDs). Các CCD này chuyển các tín hiệu ánh sáng từ bộ cảm
nhận ánh sáng bố trí ở phía trước camera thành các tín hiệu điện mà sau đó được
mã hoá thành tín hiệu TV.
Loại camera chất lượng cao thì cho tín hiệu ít nhiễu và có độ nhậy cao với ánh
sáng. Khi bạn chọn mua camera thì bạn cần chú ý đến các thấu kính của máy. Tôi
đề nghị bạn nên chọn một thấu kính từ 18 đến 108 mm với f-stop từ 2.5 đến 18.
Một vài người bán hàng sẽ cung cấp trọn gói camera và thấu kính.
Sau đây là danh sách các nhà sản xuất:
1. Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086. Tel. 408-
773-1550; fax 408-737-2966.
2. Sony Corp. of America, Component Products Co., 10833 Valley View St.,
Cypress, CA 90630. Fax 714-737-4285.
3. Parasonic, industrial camera division: 201-329-6674.
4. JVC Professional: 1-800-JVC-5825.
Monitor video. Một số các nhà sản xuất (như Sony) sản xuất các loại monitor
đen trắng chất lượng cao. Bạn nên sử dụng loại monitor chất lượng cao, vì sử dụng
các monitor chất lượng thấp có thể làm bạn nhầm lẫn kết quả. Một monitor 9 inch
là đủ cho yêu cầu làm việc của bạn. Để hiển thị ảnh màu, bạn nên dùng một
monitor đa hệ.
Máy tính. Phần mềm cho ở trong sách này được phát triển để làm việc trên tất
kế đơn giản được giới thiệu nhằm cung cấp IIRs pha tuyến tính hai
chiều ổn định.
Chương 10 nói đến các kỹ thuật khôi phục ảnh.
Chương 11 đề cập đến màu và xử lý ảnh màu. Giới thiệu các màu cơ sở và sự
hoà trộn các màu dựa trên các màu chính.
Chương 12 đề cập đến mạng thần kinh cho việc phân loại màu.
Chương 13 nói về chủ đề nén dữ liệu ảnh.
Chương 14 đề cập chi tiết về tín hiệu vô tuyến và chuẩn vô tuyến. Giới thiệu về
lĩnh vực mạch lọc lai hai chiều và giải thích ứng dụng của mạch lọc lai
hai chiều trong tín hiệu vô tuyến.
Chương 15 nói đến chủ đề mạch lọc lai hai chiều. Giải thích về phương pháp
thiết kế.
Chương 16 thiết kế phần cứng cho việc xử lý tín hiệu vô tuyến trong thời gian
thực. Nghiên cứu sự thực hiện pipelining, systolic và semisystolic.
Chương 17 cung cấp chỉ dẫn về mạch lọc ba chiều, để có thể dùng làm ảnh
“chuyển động”.
Từ chương 2 đến chương 15 có chứa các chương trình nguồn C, thực hiện các
thuật toán. Các ứng dụng liên quan đi kèm ở tất cả các chương.
7
chương
2
Các hệ thống hai chiều
2.1 Chỉ dẫn
Các tín hiệu vốn là hai chiều thì phải được xử lý bằng kỹ thuật xử
lý tín hiệu hai chiều. Các điểm ảnh được coi là một dạng tín hiệu hai
chiều, vì vậy việc xem xét các kiến thức cơ bản của hệ thống hai
chiều (2-D) là cần thiết. Trong chương này chúng ta sẽ xem xét biểu
diễn tần số và biểu diễn không gian của tín hiệu hai chiều, và cung
) thường được
ký hiệu tắt là x(n
1
,n
2
) và biểu diễn cho cường độ sáng hay là biên độ
tín hiệu tại điểm (n
1
,n
2
) trong miền không gian. Hình 2.1 giới thiệu
một phép biểu diễn trong miền không gian, ở đây cường độ sáng
của tín hiệu được ký hiệu bởi chiều cao tại điểm x(n
1
T
V
, n
2
T
H
). Chú
ý rằng T
V
là khoảng cách lấy mẫu giữa hai cột dọc kế tiếp nhau, T
H
là khoảng cách lấy mẫu giữa hai dòng ngang kế tiếp nhau của tín
hiệu 2-D.
Mặc dù một tín hiệu lấy mẫu 2-D có thể xử lý như các dãy của tín
hiệu lấy mẫu một chiều bằng cách xử lý tất cả các hàng (cột) một
1 2
),(),(),(
22112121
k k
knknhkkxnny
(2.2)
Hình 2.1 Biểu diễn trong miền khoảng cách.
2.3 Một số dãy 2-D thông dụng
Chúng bao gồm:
1. Dãy xung đơn vị :
n
1
T
v
2T T
21021
nn
nnunn
(2.3)
2. Dãy nhảy bậc đơn vị :
l¹i cßn hîp trêng c¸c víi
víi
0
0, 1
),(
21
211
nn
nnu
(2.4)
3. Dãy hàm mũ:
Hình 2.2 Xử lý tín hiệu 2-D.
2.4 Đáp ứng tần số của hệ thống 2-D -TTBB
Đặt
)(
21
2211
),(
nnj
ennx
Đáp ứng ra có thể rút ra khi dùng biểu thức (2.2).
1
21
2
)()(
212121
Hnnxnny
Tín hiệu ra là tín hiệu hình sin phức (sinusoid) hoàn toàn có cùng
tần số như tín hiệu vào, nhưng biên độ và góc pha thì bị thay đổi bởi
h(n
1
,n
2
)
x(n
1
,n
2
) y(n
1
,n
2
)
10
hàm khuyếch đại phức H(
1
,
2
). Hàm khuếch đại này gọi là đáp
ứng tần số và được cho bởi
)(
được gọi là nhân. Nếu khoảng cách cách lấy
mẫu T
V
,T
H
đã được biết thì biểu thức (2.9) có thể viết lại thành
2
21
1
),(2
21
),(),(
k
TvkTukj
HV
k
HV
eTkTkhvuH
(2.10)
2121
HH
(2.11)
),()2,2(
2121
HH
Và từ (2.10) ta có thể viết
),(,
1
vuHv
T
uH
V
T
V
T
H