Kỹ thuật khảm ảnh và ứng dụng - Pdf 23


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

1
MỤC LỤC
Trang
PHẦN MỞ ĐẦU 3

Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHẢM ẢNH 5

1.1.

Khái quát về xử lý ảnh 5

1.1.1.

Hệ thống xử lý ảnh 6

1.1.2.

Ảnh và biểu diễn ảnh 9

1.1.3.

Mức xám và lược đồ mức xám 11

1.2.

Khảm ảnh 13

1.2.1.

346

2.2.

Kỹ thuật nâng cao chất lượng ảnh 38

2.2.1.

Kỹ thuật lọc trung bình 38

2.2.2.

Kỹ thuật lọc trung vị 40

2.3. Kỹ thuật khảm kết hợp nắn chỉnh hình dạng và hiệu chỉnh mức xám 42

2.3.1.

Nắn chỉnh biến dạng 44

2.3.2. Khảm ảnh dựa trên tập điểm đặc trưng 47

2.3.3. Hiệu chỉnh mức xám 48

Chương 3: ỨNG DỤNG KHẢM ẢNH 52

3.1. Một số ứng dụng của khảm ảnh 52

3.2. Chương trình thực nghiệm 56


nên một bức ảnh với tầm nhìn rộng hơn hoặc chi tiết hơn một bức ảnh riêng lẻ
thông thường. Trong quảng cáo hoặc đồ hoạ vi tính, kỹ thuật này cũng được sử
dụng để tạo nên các bức ảnh nhân tạo từ các ảnh riêng biệt một cách hợp lý.
Khi khảm hai ảnh với nhau, một vấn đề kỹ thuật đặt ra là làm sao cho
đường biên giữa chúng bị che giấu. Như chúng ta đã biết, sự khác biệt mức
xám rất nhỏ giữa hai bên đường biên cũng có thể dễ dàng nhận thấy. Thật
không may là sự chênh lệch mức xám như thế thường không thể tránh khỏi do
một số nhân tố như sự khác nhau về vị trí đặt máy ảnh hoặc quá trình tiền xử
lý. Vì vậy, đòi hỏi phải có kỹ thuật chỉnh sửa các mức xám của ảnh trong miền
lân cận của biên để tạo nên một miền chuyển tiếp trơn giữa các bức ảnh.

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

4
Xuất phát từ hoàn cảnh đó, em lựa chọn đề tài: ―Kỹ thuật khảm ảnh và
ứng dụng‖ là một việc làm không chỉ có ý nghĩa khoa học mà còn mang đậm
tính thực tiễn, nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống thuộc
dạng này.
Về lý thuyết: Tìm hiểu khái quát về xử lý ảnh và một số kỹ thuật khảm ảnh.
Về thực tiễn: Trên cơ sở các kiến thức đã thu thập, tổng hợp các kỹ thuật để
hướng đến ứng dụng thực tế cho các kỹ thuật tìm hiểu này.
Ngoài tài liệu tham khảo và phụ lục, cấu trúc luận văn bao gồm phần mở
đầu, phần kết luận và ba chương nội dung, cụ thể:
 Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ KHẢM ẢNH
 Chương 2: MỘT SỐ KỸ THUẬT KHẢM ẢNH
 Chương 3: ỨNG DỤNG KHẢM ẢNH
Nói chung, xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh và
phục hồi các thông tin bị sai lệch của ảnh trong quá trình chụp. Các chương
trình xử lý ảnh thực hiện các phép xử lý đối với ảnh số trên máy tính. Việc xử
lý, biến đổi ảnh có sử dụng đến các kỹ thuật khảm ảnh nhằm chỉnh sửa các


Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

6
Đồ họa máy tính (Computer graphics) nghiên cứu về cơ sở toán học, các
thuật toán cũng như các kỹ thuật để vẽ, hiển thị và điều khiển hình ảnh trên màn
hình máy tính. Các ứng dụng chính của đồ họa máy tính liên quan đến mô
phỏng hình và chuẩn đoán hình ảnh, tạo mô hình, hoạt cảnh, hỗ trợ thiết kế đồ
họa và huấn luyện ảo.
Thị giác máy (Computer vision) là ngành khoa học và công nghệ làm cho
máy móc có khả năng “nhìn”. Thị giác máy bao gồm cả việc thu nhận, xử lý,
phân loại và nhận dạng ảnh để cuối cùng đưa ra quyết định. Các ứng dụng
chính của thị giác máy liên quan đến điều khiển quá trình, xác định sự kiện, tổ
chức thông tin, mô hình hóa vật thể và tương tác người - máy.
Ranh giới giữa xử lý ảnh, đồ họa máy tính và thị giác máy chỉ mang tính
tương đối. Chúng có mối liên hệ mật thiết, tương hỗ và có những phần giao
thoa với nhau.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm
cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể
là một ảnh “tốt hơn” hoặc một kết luận.
1.1.1. Hệ thống xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay
một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ
xem xét các bước cần thiết trong xử lý ảnh. Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

7


đòi hỏi dung lượng bộ nhớ lớn, tốn kém mà nhiều khi không hiệu quả theo
quan điểm ứng dụng. Thường người ta không biểu diễn toàn bộ ảnh thô mà tập
trung đặc tả các đặc trưng của ảnh như biên ảnh (boundary) hay vùng ảnh
(region). Một số phương pháp biểu diễn thường dùng:
- Biểu diễn mã loạt dài (Run-Length Code).
- Biểu diễn mã xích (Chaine -Code).
- Biểu diễn mã tứ phân (Quad-Tree Code).
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu
xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm
bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử
lý ảnh theo cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay
đã xử lý theo các phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri
thức- hệ quyết định được phát huy.
 Đối sánh rút ra kết luận

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

9
So sánh ảnh sau bước hậu xử lý với mẫu chuẩn hoặc ảnh đã được lưu trữ
từ trước, phục vụ cho các mục đích nhận dạng và nội suy ảnh.
Nhận dạng ảnh (Image recognition) là quá trình phân loại các đối tượng
được biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán
cho đối tượng một tên gọi ) dựa theo những qui luật và các mẫu chuẩn.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (text), nhận dạng vân tay, nhận dạng mã vạch, nhận
dạng mặt người…
Nội suy (Image interpretation) là phán đoán theo ý nghĩa trên cơ sở nhận
dạng. Ví dụ, một loạt chữ số và nét gạch ngang trên phong bì thư có thể được

8
=256) bởi vì mỗi phần tử ảnh được mã hóa bởi một
byte. Khi quan tâm đến ảnh màu, ta có thể mô tả màu qua ba hàm số: thành
phần màu đỏ qua hàm R(x,y), thành phần màu lục qua hàm G(x,y) và thành
phần màu lam qua hàm B(x,y).
Số điểm ảnh tạo nên một ảnh gọi là độ phân giải (resolusion). Độ phân
giải thường được biểu thị bằng số điểm ảnh theo chiều dọc và chiều ngang của
ảnh. Ảnh có độ phân giải càng cao càng rõ nét. Như vậy, ảnh càng to thì càng
bị vỡ hạt, độ mịn càng kém. Ảnh có thể được biểu diễn theo mô hình Vector
hoặc mô hình Raster:
 Mô hình Raster
Đây là mô hình biểu diễn ảnh thông dụng nhất hiện nay. Ảnh được biểu
diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi điểm
ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô hình Raster rất thuận lợi
cho hiển thị và in ấn.
Khi xử lý các ảnh Raster, chúng ta quan tâm đến mối quan hệ trong vùng
lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên một lưới (Raster)
hình vuông, lưới hình lục giác hoặc theo một cách hoàn toàn ngẫu nhiên với

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

11
nhau. Cách sắp xếp theo hình vuông là được quan tâm đến nhiều nhất và có hai
loại: điểm 4 láng giềng (4 liền kề) hoặc 8 láng giềng (8 liền kề) được minh hoạ
như sau:

Hình 1.2. Quan hệ giữa các điểm ảnh

ảnh có thể khác nhau.
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu do
Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản:
Red(đỏ), Green(lục) và Blue(lam). Mỗi điểm ảnh của ảnh màu lưu trữ trong 3
bytes và do đó ta có 2
8x3
= 2
24
màu ( cỡ 16,7 triệu màu).
Ảnh xám là ảnh chỉ có các mức xám. Thực chất màu xám là màu có các
thành phần R, G, B trong hệ thống màu RGB có cùng cường độ. Tương ứng với
mỗi điểm ảnh sẽ có một mức xám xác định.
 Lược đồ mức xám (Histogram)
Lược đồ mức xám của một ảnh, từ này về sau ta qui ước gọi là lược đồ xám
hay biểu đồ tần suất, là một hàm cung cấp tần suất xuất hiện của mỗi mức xám.
Lược đồ xám được biểu diễn trong hệ tọa độ vuông góc Oxy. Trong hệ tọa độ này,
trục hoành biểu diễn cho số mức xám từ 0 đến N, N là số mức xám (256 mức
trong trường hợp ảnh xám mà chúng ta đang xét). Trục tung biểu diễn số điểm ảnh

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

13
cho một mức xám (số điểm ảnh có cùng mức xám). Cũng có thể biểu diễn khác đi
một chút: trục tung là tỉ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh.

Hình 1.3. Lược đồ xám của ảnh
Lược đồ xám cung cấp rất nhiều thông tin về phân bố mức xám của ảnh.
Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh. Tính động của ảnh cho
phép phân tích trong khoảng nào đó phân bố phần lớn các mức xám của ảnh:
ảnh rất sáng hay ảnh rất đậm. Nếu ảnh sáng, lược đồ xám nằm bên phải (mức

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

15
tranh ấn tượng sẽ xuất hiện như một tập hợp các nét vẽ nhỏ nhiều màu sắc,
nhưng ở một khoảng cách nhất định, các đường nét đó lại kết hợp với nhau tạo
nên một hình ảnh tổng thể hoàn toàn khác. Những bức tranh như vậy được gọi
là tranh khảm (mosaic painting). Để vẽ tranh khảm, người họa sĩ phải hình
dung ra bức tranh tổng thể trước, sau đó tái tạo lại hình ảnh đó một cách chính
xác bằng cách sắp xếp và hiệu chỉnh các dấu hiệu nhỏ hơn (smaller figure – có
thể là các nét vẽ, cũng có thể là các bức tranh nhỏ li ti), mà từ đó bức tranh lớn
được cấu tạo thành.
Lấy cảm hứng từ các tác phẩm nghệ thuật đó, nhiều nhà nghiên cứu trong
lĩnh vực khoa học máy tính đã khám phá cách tạo ra những bức tranh như thế
một cách tự động hoặc bán tự động. Năm 1990, Haeberli đã mô tả một phương
pháp tạo ra một bức ảnh mà khi nhìn tổng thể, nó trông giống một bức tranh
mẫu đã cho trước, nhưng thực chất nó lại được cấu tạo bởi những nét vẽ nhỏ li
ti (tiny brush stroke). Năm 1996, Meier đã mở rộng nghiên cứu này để áp dụng
cho hình động 3D và năm 1997, Litwinowicz tiếp tục mở rộng cho video. Năm
1995, những nghiên cứu của Ostromoukhov và Hersch sử dụng các bức ảnh
thay vì các nét vẽ như Haeberli. Năm 1998, các nghiên cứu của Adam
Finkelstein and Marisa Range tương tự như của Ostromoukhov nhưng họ thao
tác trên ảnh đa mức xám và ảnh màu, thay vì ảnh đen trắng như Ostromoukhov.
Dưới đây là một trong số các tác phẩm của Finkelstein:

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

16

Hình 1.5. John F. Kennedy, 1994
Hình ảnh này được tạo bằng cách chia bức ảnh của Marilyn thành các

trung bình của phân vùng trong ảnh mẫu mà chúng được khảm vào. Để thu
được ảnh khảm kết quả M giống với ảnh mẫu I nhất thì từng mắt lưới của M
cần phải được khảm bằng một ảnh nhỏ phù hợp nhất. Nhiều kỹ thuật được ứng
dụng trong lĩnh vực này như khớp biểu đồ màu sắc, khớp cạnh, phân tích cấu
trúc, phân tích hình khối …

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

18
- Bước 4: Chỉnh sửa màu sắc
Sau khi sắp xếp các ảnh nhỏ, việc tiếp theo là chỉnh sửa màu sắc của
chúng để làm cho ảnh khảm khớp với ảnh mẫu hơn. Cụ thể là khớp màu của
ảnh nhỏ với màu của phân vùng trong ảnh mẫu mà nó phủ (khảm) lên. Nếu
trong vùng này, ảnh mẫu có màu (hoặc cường độ sáng với ảnh đa mức xám) x
là hằng số, thì chúng ta muốn thay đổi màu của ảnh nhỏ sao cho màu trung bình
của nó bằng x. Nếu cường độ sáng của ảnh mẫu biến thiên từ tối-ở bên trái tới
sáng-ở bên phải của phân vùng thì chúng ta cũng muốn cường độ sáng của ảnh
nhỏ tương ứng cũng có chiều hướng như vậy… Tuy nhiên, trong khi thay đổi màu
sắc, các đặc tính riêng của các ảnh nhỏ vẫn phải được bảo toàn tối đa.
 Khảm ảnh toàn cảnh
Các máy ảnh thông thường bị hạn chế về thị trường (field of view) và độ
phân giải nên ảnh thu được thường có tầm nhìn tương đối hẹp, ngay cả khi
dùng chế độ wide (màn hình rộng). Nhưng trong một số ứng dụng, người ta
muốn thu được ảnh với tầm nhìn rộng hơn như khi chụp hình bao quát cả một
không gian rộng lớn chẳng hạn. Máy ảnh toàn cảnh chuyên dụng (panoramic
camera) có thể đáp ứng được yêu cầu này. Điểm khác biệt cơ bản giữa
panoramic camera và camera thông thường nằm ở tiêu cự của ống kính. Tiêu
cự của máy ảnh là thông số cho biết góc nhìn của máy ảnh, nghĩa là khoảng
phạm vi mà máy ảnh có thể “thâu tóm” được. Thông thường thấu kính của máy
ảnh có độ dài 36-60mm (normal lens), dài hơn là thấu kính tele (telephoto lens)

Các nhiếp ảnh gia thực hiện ghép ảnh toàn cảnh bằng tay nhờ kỹ thuật dán
kính ảnh ướt (wet-plate). Ví dụ, bức ảnh dưới đây được chụp bởi nhiếp ảnh gia
George N. Barnard:

Hình 1.7. Quang cảnh nhìn từ đỉnh núi Lookout, Tennessee, 1864

Quy trình ghép chuỗi các ảnh thành ảnh toàn cảnh đã được nghiên cứu để
có thể thực hiện một cách tự động hoặc bán tự động. Năm 1992, Brown nghiên
cứu các kỹ thuật sắp xếp ảnh. Nghiên cứu lĩnh vực này còn có Szeliski (1994),
McMillan và Bishop (1995), Kang và Szeliski (1997). Năm 1997, Szeliski và
Shum giới thiệu một hệ thống tạo ra ảnh toàn cảnh. Ảnh toàn cảnh này được tạo
ra từ các ảnh được chụp bằng máy cầm tay. Với kỹ thuật làm mờ bóng
(deghosting), những sự thay đổi nhỏ về điểm nhìn có thể được khắc phục. Năm
1997, Zoghiami giới thiệu một phương pháp sắp xếp các ảnh có sự chênh lệch
đáng kể về góc quay và độ phóng đại. Năm 1998, Capel và Zisserman giới thiệu
một kỹ thuật khảm khác với độ phóng đại siêu phân giải (supper-resolution).
Ngày nay, người ta thường sử dụng các phần mềm ghép ảnh chuyên dụng
để tạo ra ảnh toàn cảnh. Trong hình 1.8, với đầu vào là 6 ảnh rời, phần mềm
ghép ảnh cho kết quả là một ảnh toàn cảnh tương ứng:

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

21

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

22

quét,…cũng có thể tạo ra sự khác biệt cường độ, từ đó tạo ra các đường nối
giữa chúng. Vấn đề này có thể được giải quyết bằng nhiều kỹ thuật khác nhau
như khớp biểu đồ màu sắc (histogram matching), đan đa phân giải
(Multiresolution spline), lọc…

Tóm lại, cả hai kiểu khảm ảnh trên đều là ghép các ảnh nhỏ thành ảnh
khảm. Mục tiêu của khảm ảnh nhiều lớp là tạo ra ảnh khảm trông giống với
bức ảnh mẫu nhất. Còn mục tiêu của khảm ảnh toàn cảnh là tạo ra ảnh khảm
có tính liên tục. Nói cách khác, khảm ảnh nhiều lớp chú trọng đến hình khối và
màu sắc. Còn khảm ảnh toàn cảnh chú trọng đến chi tiết đường nét. Vì thế, các
kỹ thuật trong khảm ảnh nhiều lớp tập trung vào khâu hiệu chỉnh màu sắc. Còn
các kỹ thuật trong khảm ảnh toàn cảnh chú trọng vào các khâu sắp xếp ảnh và
làm trơn các miền chuyển tiếp giữa các ảnh thành phần.
1.2.2. Một số kỹ thuật khảm ảnh
 Đan đa phân giải (Multiresolution spline).
 Lọc trung bình (Mean filter).
 Lọc trung vị (Median filter).
 Khớp biểu đồ màu sắc ( Color histogram matching).
 Khớp cạnh (Edge matching).

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên

24
 Phân tích cấu trúc (Texture analysis).
 Phân tích hình khối (Shape analysis).
 Wavelets-based image matching.
Hiện nay, một số phần mềm khảm ảnh đang được sử dụng như Easy


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status