Chương 2: Thu Nhận Ảnh
18
Chương 2
THU NHẬN ẢNH
2.1 Các thiết bị thu nhận ảnh
Hai thành phần cho công ñoạn này là linh kiện nhạy với phổ năng lượng ñiện từ
trường, loại thứ nhất tạo tín hiệu ñiện ở ñầu ra tỷ lệ với mức năng lượng mà bộ cảm
biến (ñại diện là camera); loại thứ hai là bộ số hoá (hình 2.1)
Hình 2.1 Sơ ñồ quá trình xử lý ảnh
2.1.1 Bộ cảm biến ảnh
Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp,
vidicon trong camera truyền hình). Có nhiều loại máy cảm biến (Sensor) làm việc
với ánh sáng nhìn thấy và hồng ngoại như: Micro Densitometers, Image Dissector,
Camera Divicon, linh kiện quang ñiện bằng bán dẫn. Các loại cảm biến chụp ảnh dạng
số hoá phải là phim âm bản. Camera divicon và linh kiện bán dẫn quang ñiện có thể
cho ảnh ghi trên băng từ hoặc ảnh số hoá. Trong Micro Densitometer phim và ảnh
chụp ñược gắn trên mặt phẳng hoặc cuốn quang trống. Việc quét ảnh thông qua tia
sáng (ví dụ tia Laser) trên ảnh ñồng thời dịch chuyển mặt phim hoặc quang trống
tương ñối theo tia sáng. Trường hợp dùng phim, tia sáng ñi qua phim.
Bây giờ chúng ta ñề cập ñến tất cả các khối trong hệ thống.
a. Thiết bị nhận ảnh
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu
truyền hình cung cấp từ một camera, hoặc từ một ñầu máy VCR. Ảnh số sau ñó
Chương 2: Thu Nhận Ảnh
và có ñộ nhạy cao với ánh sáng. Khi chọn camera cần chú ý ñến các thấu kính từ
18 ñến 108 mm.
c. Màn hình video
Một số nhà sản xuất (như Sony) sản xuất các loại màn hình ñen trắng chất
lượng cao. Nên sử dụng loại màn hình chất lượng cao, vì màn hình chất lượng
thấp có thể làm bạn nhầm lẫn kết quả. Một màn hình 9 inch là ñủ cho yêu cầu
làm việc. ðể hiển thị ảnh màu, nên dùng một màn hình ña hệ.
Chương 2: Thu Nhận Ảnh
20
d. Máy tính
Cần có một máy tính P4 hoặc cấu hình cao hơn. ðể chắc chắn, các máy
này phải có sẵn các khe cắm cho phần xử lý ảnh. Các chương trình thiết kế và
lọc ảnh có thể chạy trên bất kỳ hệ thống nào. Các chương trình con hiển thị ảnh
dựng vỉ mạch VGA và có sẵn trên ñĩa kèm theo. Các chương trình con hiển thị
ảnh cũng hỗ trợ cho hầu hết các vỉ mạch SVGA
2.1.2 Hệ tọa ñộ màu
a. Khái niệm
Năm 1931: CIE (Commision Internationale de l’Éclairage) xây dựng màu
cơ sở chuẩn quốc tế:
•
Cho phép các màu khác ñược ñịnh nghĩa như tổng trọng lượng của ba màu
cơ sở.
•
Do không tồn tại 3 màu cơ sở chuẩn trong phổ nhìn thấy ñể tổng hợp màu
mới → CIE sử dụng các màu tưởng tượng.
•
(2.1)
Nhưng x+y+z=1 cho nên chỉ cần 2 giá trị có thể xác ñịnh màu mới
•
Cho khả năng biểu diễn mọi màu trên biểu ñồ 2D -> Biểu ñồ CIE
b. Biểu ñồ CIE
Khi vẽ các giá trị x, y của màu trong phổ nhìn thấy -> Biểu ñồ CIE là ñường
cong hình lưỡi (còn gọi là biểu ñồ kết tủa – CIE Chromaticity Diagram). Các
ñiểm màu gán nhãn trên ñường cong từ violet (400 nm) ñến red (700 nm). ðiểm
C tương ứng màu trắng (ánh sáng ban ngày). Biểu ñồ CIE là phương tiện lượng
hóa ñộ tinh khiết và bước sóng trội:
•
ðộ tinh khiết của ñiểm màu C1: ñược xác ñịnh bằng khoảng cách tương ñối
của ñoạn thẳng nối C với ñường cong qua C1.
Chương 2: Thu Nhận Ảnh
21
•
Màu bù: biểu diễn bởi 2 ñiểm cuối C3, C4 của ñoạn thẳng ñi qua C.
•
Gam màu xác ñịnh bởi 2 ñiểm: biểu diễn bởi ñoạn thẳng nối hai ñiểm màu
C5, C6.
•
Gam màu xác ñịnh bởi 3 ñiểm: ba ñiểm C7, C8, C9 chỉ xác ñịnh màu trong
tam giác.
Hình 2.2 Hình vẽ biểu ñồ màu
CIE
Trong cách bi
ểu
ñỏ + l
ục +
Công thức n
ày g
ba ñường ñứt ño
ạn gọ
tính bởi:
trắng
CIE
=
c. Bi
ến ñổi hệ tọa ñộ m
Hệ tọa ñộ m
àu d
bi
ểu diễn hết các m
người ta ñ
ưa ra các h
Thí dụ:
•
Mô hình màu R
TV.
•
Mô hình HSV: N
ạn gọi l
à tam giác Maxwell. Màu tr
ắng trong h
=
(ñỏ
CIE
+ lục
CIE
+ lơ
CIE
) = 1
ộ m
àu
àu do CIE ñ
ề xuất có tác dụng như m
ột hệ q
các m
àu. Trên thực tế, phụ thuộc vào các
ứn
các h
ệ biểu diễn màu khác nhau.
màu RGB: ánh sáng Red, Green và Blue
ứ
ng d
SV: Nh
ận thức của con người.
YK: Máy in.
ứng dụng khác nhau
ng d
ụng cho màn hình,
àu ñư
ợc thực hiện theo
àu ban ñ
ầu; χ’ không
ñổi. Ta có quan hệ sau:
(2.5)
ới chất m
àu trắng và
ầu từ m
àu tinh khiết, bổ
Chương 2: Thu Nhận Ảnh
23
sung ñen ñể có bóng (shade) màu. Nếu bổ sung chất màu trắng sẽ có tint khác
nhau. Bổ sung cả chất màu trắng và ñen sẽ có tone khác nhau. Cách biểu diễn
này trực giác hơn mô tả màu bằng ba màu cơ sở. Các bộ chương trình ñồ họa có
cả hai mô hình màu: cho người sử dụng dễ tương tác với màu, các thành phần
màu ứng dụng trên các thiết bị.
ðể tiện biểu diễn, các không gian màu dưới ñây ñều ñược chuẩn hóa về 1
Mọi màu ñược biểu diễn bởi không gian màu RGB ñều là sự pha trộn của 3
thành phần màu cơ bản (Red, Green, Blue).
Mô
hình
24 Hình 2.4 Cộng và trừ màu
f. Mô hình màu CMYK
Là sự mở rộng mô hình màu CMK bằng cách thêm vào thành phần màu
Black (K). Bởi vì với thành phần màu Black tinh khiết sẽ cho ta ñộ tương phản
cao hơn.
Hình 2.5 Không gian màu CMYK
Mối quan hệ CMY và CMYK
K = min(C, M, Y)
C = C - K
M = M - K
Y = Y - K
g. Mô hình màu HSV
Thay vì chọn các phần tử RGB ñể có màu mong muốn, người ta chọn các tham
số màu: Hue, Saturation và Value (HSV)
Mô hình HSV s
ñường chéo từ
White
nón HSV.
•
Hue: Bướ
c sóng
ố hoá ả
•
Bướ
c 1: ðo giá t
•
Bước 2:
Ánh x
mức rời rạc g
ọ
Chư
25
Hình 2.6 Không gian màu HSV
HSV suy di
ễn từ
mô hình RGB: hãy quan sát h
White ñ
ến Black (gốc) → ta có hình lục giác, s
ử
c sóng g
ốc củ
a ánh sáng. Trong mô hình Hue
n 360
o
ng ñ
ộ hay ñộ chói ánh sáng. Value có giá tr
ị
o giá tr
ị trên các khoảng không gian gọi là lấ
y m
nh x
ạ cường ñộ (hoặc giá trị) ño ñược thành
ọ
i là lượng tử hoá.
Chương 2
: Thu Nhận Ảnh
n sát hình h
ộp RGB theo
ử
dụng làm ñỉnh hình
Hue
ñược biểu diễn bằng
ị
[0, 1], V=0 → màu
trong kho
ảng [0, 1]. Biểu
t
cực ñại.
GB. B
ắt ñầu từ Hue (H
ng, thay ñ
ổi V: Bổ sung
m
ặt phẳng hai chiều.
h. Phư
ơng pháp biến ñổi
a. Khoảng lấy m
ẫu (Sam
•
Ảnh lấy mẫu
mẫu trong kh
ôn
mẫu một chi
ều
− )(
0
xx
δ
∫
+∞
∞−
−(
x
x
δ
•
Ti
ếp theo chúng
Chư
26
Hình 2.
6 Sơ ñồ lấy mẫu và lượng tử hóa
pling)
=∞
≠
=
0
00
xkhi
xkhi
∫
+
−
=−=
0
0
1)()
00
x
x
dxxxdx
x
δ
chúng ta ñịnh nghĩa h
àm răng lư
ợc với các kho
Chương 2
: Thu Nhận Ảnh
δ
(2.7)
với r là số nguyên, ∆x là khoảng lấy mẫu
•
Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ ñến +∞).
Giả sử hàm một
chiều g(x) ñược mô tả (gần ñúng) bằng g(r Δx ) tức là:
(
)
xrgxg
∆
≈
)(
(2.8)
•
Khi ñó tín hiệu lấy mẫu ñược mô hình hoá
∑
+∞
−∞=
∆−==
r
s
xrxxgxcombxgxg )()()()()(
δ
(2.9)
hoặc tương ñương
∑
lại ñược từ tín hiệu lấy mẫu.
•
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số, (2.6) là tích chập trong miền
không gian x. Mặt khác (2.6) tương ñương với tích chập trong miền tần số
ω tức là biến ñổi Fourier của gs(x) là G
s
(ω
x
)
∑
+∞
−∞=
∆
−
∆
=
k
xxs
x
k
G
x
G )(
1
)(
ωω
(2.12)
trong ñó ω
x
•
ðịnh lý lẫy mẫu của Shannon có thể mở rộng cho không gian hai chiều.
Hàm răng lược hai chiều khi ñó ñược xác ñịnh:
)()(),( ymyxnxyxComb
n m
∆−∆−=
∑ ∑
+∞
−∞=
+∞
−∞=
δ
(2.14)
•
Hàm
lấy mẫu hai chiều thu ñược:
)()(),(),(),(),( ymyxnxyxgyxcombyxgyxg
n m
s
∆−∆−==
∑ ∑
+∞
−∞=
+∞
−∞=
δ
(2.15)
Và ∆x, ∆y ñược chọn thoả mãn các ñiều kiện tương ứng theo ñịnh lý lấy
MNgNgggNgggChương 2: Thu Nhận Ảnh
29
c. Các dạng lấy mẫu (Tesselation)
Dạng lẫy mẫu (Tesselation) ñiểm ảnh là cách bài trí các ñiểm mẫu trong
không gian hai chiều. Một số dạng mẫu ñiểm ảnh ñược cho là dạng chữ nhật, tam
giác, lục giác. Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết ñặc ñiểm
liên thông của chúng. Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về các
mẫu liền kề); mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6.
a) Mẫu ñiểm ảnh chữ nhật b) Mẫu ñiểm ảnh tam giác c) Mẫu ñiểm ảnh lục giác
Hình 2.9 Các dạng mẫu ñiểm ảnh
Cần chú ý rằng tài liệu này chỉ xét các mẫu ñiểm ảnh hình chữ nhật, ñặc
biệt là dạng hình vuông. Nhiều trường hợp ứng dụng có dùng ñến các các mẫu
tam giác hoặc lục giác.
2.2.3 Lượng tử hóa (Quantization)
Lượng tử hoá là một quá trình lượng hoá tín hiệu thật dùng chung cho các loại xử
lý tín hiệu trên cơ sở máy tính. Vấn ñề này ñã ñược nghiên cứu kỹ lưỡng và có nhiều
lời giải lý thuyết dưới nhiều giả ñịnh của các nhà nghiên cứu như Panter và Dite
(1951), Max (1960), Panter (1965)
[5].
Hình 2.10 Lượng tử hóa ảnh
Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zmin ñến lớn nhất Zmax.
Z
le
iq
−=
2.3 Một số ph
ương phá
Sau bước số hóa,
ảnh
khi ñề cập ñến vấn ñề
lưu
Chư
30
giá
trị mẫu Z cần phải biến ñổi thành một t
ập
lý.
h
oá là ánh xạ từ các số thực mô tả giá tr
ị
ực. Nói cách khác,
ñó là quá trình số hoá bi
ên
ình 2.
11 Khoảng lượng tử theo L mức xám.
giá
trị lấy mẫu (số thực) tại vị trí nào
ng pháp
biểu diễn ảnh
ảnh
sẽ ñược lưu trữ hay chuyển sang giai
ño
lưu tr
ữ ảnh, cần xem xét ảnh sẽ ñược biểu
Chương 2
: Thu Nhận Ảnh
ập
hữu hạn số bit ñể
ị
lấy mẫu thành một
ên
ñộ.
ñó của mặt phẳng
hoá giá tr
ị ñó thành một
a
x
(Hình 2.11). Khi
bộ miền vào (Z
max
ñ
ặt tại ñiểm giữa các
i
≠
∈
=
0
),(1
),(
Rnmkhi
nmu
(2.19)
Với các biểu diễn trên, một vùng ảnh hay ảnh nhị phân ñược xem như chuỗi 0
hay 1 ñan xen. Các chuỗi này ñược gọi là mạch (run). Theo phương pháp này, mỗi
mạch sẽ ñược biểu diễn bởi ñịa chỉ bắt ñầu của mạch và chiều dài mạch theo dạng
{<hàng,cột>, chiều dài}.
Hình 2.13 Mã hóa loạt dài ảnh
2.3.2 Mã xích (Chain Code)
Mã xích thường ñược dùng ñể biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ
ảnh, người ta lưu trữ dãy các ñiểm ảnh như A, B…M. Theo phương pháp này, 8
hướng của vectơ nối 2 ñiểm biên liên tục ñược mã hóa. Khi ñó ảnh ñược biểu diễn qua
ñiểm ảnh bắt ñầu A cùng với chuỗi các
từ mã. ðiều này ñược minh họa trong hình
dưới ñây:
Chương 2: Thu Nhận Ảnh
33
2.4 Các ñịnh dạng ảnh cơ bản
2.4.1 Khái niệm chung
Ảnh thu ñược sau quá trình số hóa thường ñược lưu lại cho các quá trình xử lý
tiếp theo hay truyền ñi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại nhiều
ñịnh dạng ảnh khác nhau từ ảnh ñen trắng (với ñịnh dạng IMG), ảnh ña cấp xám
cho ñến ảnh màu: (BMP, GIF, JPEG…). Tuy các ñịnh dạng này khác nhau, song
chúng ñều tuân theo một cấu trúc chung nhất. Nhìn chung, một tập ảnh bất kỳ thường
bao gồm 3 phần:
•
Mào ñầu tập (Header)
•
Dữ liệu nén (Data Compression)
•
Bảng màu (Palette Color)
a. Mào ñầu tập:
Mào ñầu tập là phần chứa các thông tin về kiểu ảnh, kích thước, ñộ phân
giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
b. Dữ liệu nén:
Số liệu ảnh ñược mã hóa bởi kiểu mã hóa chỉ ra trong phần Header.
c. Bảng màu:
Bảng màu không nhất thiết phải có ví dụ khi ảnh là ñen trắng. Nếu có, bảng
màu cho biết số màu dùng trong ảnh và bảng màu ñược sử dụng ñể hiển thị màu
của ảnh. Một số các ñịnh dạng khác, cấu hình, ñặc trưng của từng ñịnh dạng và
các tham số. Sinh viên có thể tham khảo thêm tài liệu khác.
2.4.2 Quy trình ñọc một tập ảnh
Trong quá trình xử lý ảnh, ñầu tiên phải tiến hành ñọc tập ảnh và chuyển vào bộ
nhớ của máy tính dưới dạng ma trận số liệu ảnh. Khi lưu trữ dưới dạng tập, ảnh là một
khối gồm một số các byte. ðể ñọc ñúng tập ảnh ta cần hiểu ý nghĩa các phần trong
2.5.2 Kỹ thuật ảnh
Người ta dùng kỹ thuật nửa cường ñộ ñể thể hiện ảnh trên sách báo, tạp chí. Theo
kỹ thuật này, một ảnh tạo nên bởi một chuỗi các ñiểm in trên giấy. Thực chất, mỗi
ñiểm ảnh thường gồm một hình vuông trắng bao quanh một chấm ñen. Do vậy, nếu
chấm ñen càng lớn ảnh sẽ càng xẫm màu. Màu xám có thể coi như chấm ñen chiếm
nửa vùng trắng. Vùng trắng là vùng gồm một chùm các ñiểm ảnh có rất ít hoặc
không có chấm ñen.
Từ ñặc ñiểm cảm nhận của mắt người, sự thay ñổi cường ñộ chấm ñen trong các
phần tử ảnh trắng tạo nên mô phỏng của một ảnh liên tục. Như vậy, mắt người cảm
nhận từ một ảnh mà màu biến ñổi từ ñen qua xám rồi ñến trắng. Tổng số cường ñộ duy
nhất hiện diện sẽ xác ñịnh các kích thước khác nhau của chấm ñen. Thông thường,
báo ảnh tạo ảnh nửa cường ñộ với ñộ phân giải từ 60 ñến 80 dpi (dot per inchs : số
ñiểm ảnh trên một inch), sách có thể in ñến 150 dpi.
Chương 2: Thu Nhận Ảnh
35
Tuy nhiên, các máy in ghép nối với máy tính không có khả năng sắp xếp các
chấm ñen có kích thước khác nhau của ảnh. Do ñó, người ta dùng một số kỹ thuật biến
ñổi như: phân ngưỡng, chọn mẫu, dithering (dithering sẽ ñịnh nghĩa dưới ñây).
a. Phân ngưỡng:
Kỹ thuật này ñặt ngưỡng ñể hiển thị các tông màu liên tục. Các ñiểm trong
ảnh ñược so sánh với ngưỡng ñịnh trước. Giá trị của ngưỡng sẽ quyết ñịnh ñiểm
có ñược hiển thị hay không. Do vậy ảnh kết quả sẽ mất ñi một số chi tiết. Có
nhiều kỹ thuật chọn ngưỡng áp dụng cho các ñối tượng khác nhau:
•
Hiển thị 2 màu: chỉ dùng ảnh ñen trắng có 256 mức xám. Bản chất của
phương pháp này là chọn ngưỡng dựa trên lược ñồ mức xám của ảnh. ðể
36
n phần tử sẽ tạo nên n
2
+1 mức sáng. Ma trận mẫu thường ñược chọn là ma trận
Rylander. Ma trận Rylander cấp 4 có dạng như Bảng 1.2
Việc chọn kích thước của nhóm như vậy sẽ làm giảm ñộ mịn của ảnh. Vì
vậy kỹ thuật này chỉ áp dụng trong trường hợp mà ñộ phân giải của thiết bị ra lớn
hơn ñộ phân giải của ảnh nguồn. Thí dụ: thiết bị ra có ñộ phân giải 640x480
khi sử dụng nhóm có kích thước 4x4 sẽ chỉ còn 160x120.
c. Kỹ thuật Dithering
Dithering là việc biến ñổi một ảnh ña cấp xám (nhiều mức sáng tối) sang
ảnh nhị phân (hai mức sáng tối). Kỹ thuật Dithering ñựợc áp dụng ñể tạo ra ảnh
ña cấp sáng khi ñộ phân giải nguồn và ñích là như nhau. Kỹ thuật này sử dụng
một ma trận mẫu gọi là ma trận Dither. Ma trận này gần giống như ma trận
Rylander.
ðể tạo ảnh, mỗi phần tử của ảnh gốc sẽ ñược so sánh với phần tử tương
ứng của ma trận Dither. Nếu lớn hơn, phần tử ở ñầu ra sẽ sáng và ngược lại.
2.6 Khái niệm cơ bản ảnh ñen trắng và ảnh màu
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc tín hiệu số. Trong biểu
diễn số của các ảnh ña mức xám, một ảnh ñược biểu diễn dưới dạng một ma trận hai
chiều. Mỗi phần tử của
ma trận biểu diễn cho mức xám hay cường ñộ của ảnh tại vị trí
ñó
Chương 2: Thu Nhận Ảnh 38
2.6.1 Ảnh ñen trắng
Ảnh ñen trắng chỉ bao gồm 2 màu: màu ñen và màu trắng. Người ta phân mức
ñen trắng ñó thành L mức Nếu sử dụng số bit B=8 bít ñể mã hóa mức ñen trắng (hay
mức xám) thì L ñược xác ñịnh:
L=2
B
(trong ví dụ của ta L=2
8
= 256 mức) (2.21)
Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị
phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn hơn 2 ta có ảnh
ña cấp xám.
Nói cách khác, với ảnh nhị phân mỗi ñiểm ảnh ñược mã hóa trên 1 bit, còn với
ảnh 256 mức, mỗi ñiểm ảnh ñược mã hóa trên 8 bit. Như vậy, với ảnh ñen trắng: nếu
dùng 8 bit (1 byte) ñể biểu diễn mức xám, số các mức xám có thể biểu diễn ñược là
256. Mỗi mức xám ñược biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ
0 ñến 255, với mức 0 biểu diễn cho mức cường ñộ ñen nhất và 255 biểu diễn cho
mức cường ñộ sáng nhất.
Ảnh nhị phân khá ñơn giản, các phần tử ảnh có thể coi như các phần tử logic.
Ứng dụng chính của nó ñược dùng theo tính logic ñể phân biệt ñối tượng ảnh với nền
hay ñể phân biệt ñiểm biên với ñiểm khác.
2.6.2 Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: ñỏ (R), lục
(G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách
biểu diễn cũng tương tự như với ảnh ñen trắng, chỉ khác là các số tại mỗi phần tử của
ma trận biểu diễn cho ba màu riêng rẽ gồm: ñỏ (red), lục (green) và lam (blue). ðể
biểu diễn cho một ñiểm ảnh màu cần 24 bit. 24 bit này ñược chia thành ba khoảng 8