HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
----------------------------------------
NGUYỄN VĂN HẠT
NGHIÊN CỨU MỘT SỐ KỸ THUẬT NỘI SUY ẢNH
Chuyên ngành: Truyền dữ liệu và Mạng máy tính
Mã số: 60.48.15
Người hướng dẫn khoa học: PGS. TS ĐỖ NĂNG TOÀN
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
HÀ NỘI – 2012
1
PHẦN MỞ ĐẦU
Trong những năm gần đây công nghệ thông tin phát triển với tốc độ
chóng mặt về cả phần cứng và phần mềm. Sự phát triển của công nghệ thông tin
đã thúc đẩy sự phát triển của nhiều lĩnh vực xã hội khác nhƣ y học, giáo dục,
giải trí, kinh tế,… Sự phát triển của phần cứng cả về phƣơng diện thu nhận,
hiển thị, cùng với tốc độ xử lý đã mở ra nhiều hƣớng mới cho sự phát triển phần
mềm, đặt biệt là lĩnh vực xử lý ảnh và thâm nhập mạnh mẽ vào đời sống thực tế
của con ngƣời.
Ảnh thu đƣợc sau quá trình thu nhận ảnh hoặc các phép biến đổi không
tránh khỏi nhiễu, khuyết thiếu hoặc không thể xử lý đƣợc các trƣờng hợp có độ
phức tạp cao, hay không đƣa dữ liệu bề mặt vào một định dạng làm cho gọn và
thích hợp để mô phỏng, hiển thị hoặc định vị. Sự sai sót này một phần bởi phần
cứng, các thiết bị quang học và điện tử, kỹ năng sử dụng các thiết bị chƣa tốt,
phần khác bởi bản thân các phép biến đổi không phải là toàn ánh, nên có sự ánh
xạ thiếu hụt đến những điểm trên ảnh kết quả. Việc khắc phục những nhƣợc
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NỘI SUY ẢNH
1.1 Khái quát về xử lý ảnh
Quá trình xử lý ảnh là một quá trình thao tác biến đổi ảnh đầu vào nhằm
cho ra kế t quả ảnh nhƣ mong muốn . Kế t quả đầ u ra của mô ̣t quá triǹ h xƣ̉ lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luâ ̣n.
Ảnh “Tốt hơn”
Ảnh đầu vào
Xƣ̉ lý ảnh
Kế t luâ ̣n
Hình 1.1 Quá trình xử lý ảnh
Nhƣ vâ ̣y mu ̣c tiêu của xƣ̉ lý ảnh có thể chia làm ba hƣớng nhƣ sau:
Xƣ̉ lý ảnh ban đầ u để cho ra mô ̣t ảnh mới tôt hơn theo mon g muốn của
ngƣời dùng, ví dụ ảnh mờ cầ n xƣ̉ lý để rõ nét hơn.
Phân tích ảnh để thu đƣơ ̣c thông tin nào đó giúp cho viê ̣c phân loa ̣i và nhâ ̣n
biế t ảnh. Ví dụ phân tích ảnh vân tay để trích chọn các đặc trƣng vân tay
.
Tƣ̀ ảnh đầ u vào mà có mức nhận xét, kế t luâ ̣n ở mƣ́c cao hơn, sâu hơn. Ví
dụ ảnh một vụ tai nạn giao thông phác họa hiện trƣờng một vụ tai nạn.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ
là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tƣơ ̣ng trong không gian. Sơ đồ tổng quát của mô ̣t hê ̣ thống xƣ̉ lý ảnh:
Hệ quyết
định
Thu nhận
ảnh
1.2.3 Mức xám của ảnh
Mức xám của điểm ảnh là cƣờng độ sáng của điểm ảnh đƣợc gán bằng giá
trị số tại điểm đó. Trong biểu diễn số của các ảnh đa mức xám, một ảnh đƣợc
biểu diễn dƣới dạng một ma trận hai chiều. Mỗi phần tử trong ma trận biểu diễn
cho mức xám hay cƣờng độ sáng của ảnh tại vị trí đó. Mỗi phần tử trong ma
trận đƣợc gọi là một phần tử ảnh hoặc điểm ảnh. Một điểm ảnh có hai đặc trƣng
cơ bản là vị trí (x,y) của điểm ảnh và độ xám của nó.
1.2.4 Nắn chỉnh biến dạng
Nắn chỉnh biến dạng là việc biến đổi hình học giữa hai ảnh: ảnh nguồn và
ảnh đích. Sự biến đổi hình học đƣợc định nghĩa về mối quan hệ giữa các điểm ảnh
nguồn và điểm ảnh đích.
Thuật toán nắn chỉnh ảnh có hai khuynh hƣớng: tác động toàn cục hoặc tác
động cục bộ. Tác động toàn cục là ta áp dụng thuật toán, tiêu chí nhƣ nhau đối với
mọi điểm ảnh trên toàn bộ ảnh. Còn tác động cục bộ thì ta chỉ tác động trên các
điểm ảnh ở một số vùng của ảnh, còn các vùng khác của ảnh ta giữ nguyên.
Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tƣơng đối nhanh nhƣng
chỉ áp dụng đƣợc với các yêu cầu đơn giản nhƣ co, giãn ảnh, bóp méo cả ảnh
thành tứ giác hay một số hiệu ứng khác nhƣ mắt cá, kính núp,…
5
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tƣợng hơn. Tuy nhiên để nắn
chỉnh từng vùng, ta phải xác định thêm tập đặc trƣng. Trong trƣờng hợp này
việc xây dựng thuật toán tƣơng đối phức tạp.
a) Ảnh gốc
b) Ảnh qua xử lý
Hình 1.3 Ví dụ về nắn chỉnh hình biến dạng
đột ngột về mức xám. Tập hợp các điểm biên tạo thành đƣờng bao của ảnh.
1.2.8 Toạ độ ảnh
a. Toạ độ pixel
Phƣơng pháp thuận tiện nhất cho việc biểu diễn vị trí trong một ảnh là sử
dụng toạ độ pixel. Ở hệ toạ độ này, ảnh đƣợc xử lý nhƣ một lƣới của các phần
tử riêng biệt đƣợc đánh thứ tự từ đỉnh tới đáy và từ trái sang phải.
b. Toạ độ không gian
Trong toạ độ không gian vị trí ảnh đƣợc định vị trên một mặt phẳng, chúng
đƣợc mô tả bằng một cặp x và y (không phải r(hàng) và c(cột) nhƣ toạ độ pixel).
1.3 Nội suy ảnh
1.3.1 Khái niệm nội suy ảnh
Trong toán học, nội suy là phƣơng pháp xây dựng các điểm mới dự liệu
trong phạm vi của tập hợp những điểm rời rạc dữ liệu đã biết.
Trong kỹ thuật và khoa học có một số điểm thu đƣợc bằng việc lấy mẫu hay
thí nghiệm, sau đó ta xây dựng một chức năng cho gần gũi phù hợp với những
điểm đó.
Nội suy là một giải thuật phần mềm dùng để thêm vào (hoặc bỏ bớt) số
điểm ảnh trên ảnh, nó làm thay đổi dung lƣợng của tập tin, nhƣng không thêm
thông tin gì mới cho ảnh.
Trong xử lý ảnh phép nội suy ảnh thƣờng đƣợc sử dụng trong các công
đoạn nhƣ bóp méo, nắn chỉnh, lấp lỗ hổng hay trong sự phóng to của bức ảnh.
7
Các ứng dụng của nội suy bao gồm hình ảnh luân chuyển, mở rộng quy mô, độ
phóng đại, nén hoặc tái tạo ảnh. Tiến trình nội suy dựa trên màu sắc của các
điểm ảnh cũ để xác định màu cho các điểm ảnh mới gần nó nhất. Trong xử lý
ảnh, ảnh có thể đƣợc mở rộng để chỉnh sửa chỉ tiết.
1.3.2 Các vấn đề với nội suy ảnh
Để nhận đƣợc bức ảnh cỡ lớn mà chất lƣợng đảm bảo thì chúng ta cần tạo
Ảnh ban đầu
Bóp méo
Sau nội suy
Hình 1.15 Minh họa ảnh khi phóng to và bóp méo sau khi nội suy
Ngay cả khi cùng một hình ảnh thay đổi kích cỡ hoặc bóp méo đƣợc thực
hiện, kết quả có thể khác nhau đáng kể tùy thuộc vào thuật toán nội suy.
1.3.3 Một số hướng tiếp cận nội suy ảnh
Trong xử lý ảnh để có những bức ảnh nhƣ mong muốn ta cần phải hiểu
ảnh cần xử lý thuộc loại nào và áp dụng phƣơng pháp nội suy ảnh nào cho phù
hợp. Trong chƣơng này đã nghiên cứu khái quát về xử lý ảnh và nội suy
ảnh.Chƣơng tiếp theo sẽ nghiên cứu cụ thể kỹ thuật nội suy láng giềng, nội suy
tuyến tính và nội suy sử dụng hàm cơ sở bán kính.
9
CHƢƠNG 2: MỘT SỐ KỸ THUẬT NỘI SUY ẢNH
Hầu hết các phần mềm xử lý ảnh đều sử dụng một hoặc nhiều phƣơng
pháp nội suy trong quá trình biến đổi ảnh. Kết quả sau quá trình biến đổi ảnh
thƣơng cho ảnh nhƣ mong muốn. Ảnh thƣờng mịn màng, trơn chu không bị vỡ
hạt khi phóng to, thu nhỏ hay bóp méo ảnh. Kết quả ảnh sau khi xử lý còn phụ
thuộc vào đối tƣợng xử lý và giải thuật nội suy. Điều quan trọng là trong giải
thuật nội suy sẽ không thêm thông tin gì mới cho ảnh mà nó chỉ thêm điểm ảnh
(pixel) và làm tăng dung lƣợng tập tin.
Khi phóng to ảnh thƣờng ảnh bị vỡ hạt nên ta không thể in hay chỉnh sửa
đƣợc. Khi đó muốn phóng to ảnh ngƣời ta thƣờng dùng phƣơng pháp chụp, rửa
hình, dùng máy quét để quét ảnh với độ phân giải cao nhƣng làm nhƣ thế rất
mất thời gian lại không kinh tế. Đến nay có nhiều nhà sản xuất phần mềm xử lý
ảnh đã khắc phục đƣợc các vấn đề này bằng cách dùng các phƣơng pháp nội
hạn nhƣ in ấn, video, xử lý ảnh, lập bản đồ kết cấu cho mô hình, kỹ thuật đơn
giản nhƣ nhân rộng pixel hoặc suy tuyến tính là không thỏa đáng do việc tạo ra
các hiện vật trực quan nhƣ điểm ảnh, đƣờng nét lởm chởm. Để khắc phục những
vấn đề này, các thuật toán mới tạo ra các hình ảnh với các cạnh sắc nét hơn. Một
phƣơng pháp tối ƣu cung cấp các hình ảnh hợp lý tự nhiên và tạo tác. Mục đích
phƣơng pháp hình ảnh mở rộng trong đó sử dụng thông tin địa phƣơng thứ hai để
thích ứng và sàng lọc, lặp đi lặp lại có thể để loại bỏ các hiện vật trong khi vẫn
giữ các tính năng hình ảnh có liên quan và kết cấu tự nhiên.
2.1.2.1 Kỹ thuật nội suy các điểm láng giềng xét lại
Một số phƣơng pháp đã đƣợc đề xuất để đoán hợp lý mô hình độ phân giải
cao từ các hình ảnh độ phân giải thấp ban đầu. Vấn đề là khá phức tạp, nói chung,
không có gợi ý về các tín hiệu độ phân giải cao thực sự có sẵn.
Các phƣơng pháp nội suy tinh vi nhất cố gắng để trích xuất thông tin thống
kê về mối quan hệ giữa các hình ảnh độ phân giải cao và thấp từ một tập hợp đào
tạo các hình ảnh tự nhiên (hoặc hình ảnh quan tâm).
Trong phƣơng pháp lặp đi lặp lại dựa trên mức độ tập hợp và đƣờng cong,
cƣờng độ liên tục làm mịn đƣợc áp dụng, cùng với một số quy tắc quảng cáo
đặc biệt để ngăn chặn sự thay đổi trong cấu trúc liên kết và tác dụng phụ khác.
Phƣơng pháp sử dụng chẩn đoán đơn giản để xác định hƣớng cạnh từ 4
điểm lân cận trong độ phân giải hình ảnh thấp và sau đó thêm nội suy điểm ảnh
11
thu đƣợc là trung bình có trọng số của những ngƣời hàng xóm, với trọng lƣợng
tùy thuộc vào hƣớng cạnh. Một cách tiếp cận tƣơng tự cũng là cơ sở của kỹ thuật
sử dụng một miếng vá lớn xung quanh 4 điểm để ƣớc tính trọng lƣợng.
2.1.2.2 Nội suy láng giềng dựa trên dẫn xuất hình ảnh thứ hai
Phƣơng pháp phóng to hình ảnh xấp xỉ hệ số 2 bằng cách sao chép các
pixel gốc (lập chỉ mục của i, j) vào một mạng lƣới mở rộng (lập chỉ mục bởi 2i,
2j) và sau đó điền khoảng cách với quy tắc dựa trên địa phƣơng cạnh thủ tục
Bƣớc thứ hai đƣợc thực hiện trong cùng một cách, tính toán xấp xỉ của
các dẫn xuất bậc hai hƣớng ngang và dọc. Ta chỉ tránh việc sử dụng các quy tắc
đơn giản này khi dẫn xuất đầu tiên của cƣờng độ lớn hơn, các dẫn xuất lớn thứ
hai đƣờng chéo để xác định hƣớng nội suy.
Hình 2.2 Nội suy dựa trên một khu phố 12-pixel
Hình ảnh thu đƣợc với phƣơng pháp này nhanh là tốt hơn so với phƣơng
pháp có tốc độ tƣơng tự. Do đó, ta cải thiện các thuật toán bằng cách thêm một
sàng lọc lặp đi lặp lại có thể để nâng cao chất lƣợng cạnh tại mỗi bƣớc nội suy
bằng cách làm mịn các dẫn xuất thứ hai hƣớng giữ giá trị pixel.
13
2.1.2.4 Nội suy láng giềng lặp đi lặp lại ICBI
Trong phần sau đây, mô tả các thủ tục và các điều kiện năng lƣợng đƣợc
sử dụng cho các bƣớc nội suy đầu tiên lấp đầy những khoảng trống trong lƣới
mở rộng tại các địa điểm (2i + 1; 2j + 1).
Sau khi bƣớc thứ hai lỗ điền (gán giá trị cho tất cả các pixel trống còn
lại), các thủ tục lặp đi lặp lại đƣợc lặp đi lặp lại một cách tƣơng tự, chỉ cần thay
thế theo chiều ngang và chiều dọc và lặp đi lặp lại sửa đổi các giá trị của các
điểm ảnh mới đƣợc thêm vào.
2.1.2.5 Nội suy láng giềng tự nhiên NN(Natural Neighbor Interpolation)
Xây dựng mô hình độ cao (DEM) kỹ thuật số từ điểm dày đặc trở nên
ngày càng quan trọng. Nội suy láng giềng tự nhiên NNI (Natural Neighbor
Interpolation) là một phƣơng pháp phổ biến để DEM xây dựng từ bộ dữ liệu
điểm nhƣng là tính toán chuyên sâu. Mô hình số độ cao (DEM) cần phải đƣợc
tạo ra dựa trên các điểm quét qua DEM nội suy. Kết quả thƣờng đƣợc biểu diễn
nhƣ là lƣới, nơi giá trị chiều cao (độ cao) đƣợc kết hợp với mỗi ô lƣới.
a. Sơ đồ Voronoi của nội suy láng giềng tự nhiên
trƣờng hợp một cột.
d. Xây dựng lưới DEM nội suy láng giềng tự nhiên
Lƣới DEM đƣợc xây dựng dựa trên nội suy láng giềng tự nhiên cho mỗi
điểm lƣới. Quá trình gán giá trị cho mỗi điểm lƣới nhƣ lƣới truy vấn. Để xem xét
chất lƣợng của DEM, chúng ta cũng nên xem xét các khoảng trống trong dữ liệu
gốc. Những khoảng trống đƣợc đánh dấu là "NO_DATA". Thay đổi các phƣơng
pháp có thể đƣợc sử dụng để chế biến những khoảng trống này, hoặc trong tiền
xử lý, chế biến sau hoặc trong quá trình nội suy.
Kết luận nội suy láng riềng tự nhiên
Trong mô tả thuật toán phƣơng trình đƣợc viết cho màu xám, tất nhiên,
hình ảnh màu sắc có thể đƣợc mở rộng trong cùng một cách bằng cách lặp lại các
thủ tục một cách độc lập cho mỗi thành phần màu hoặc hệ số nội suy tính toán độ
sáng hình ảnh và sử dụng chúng cho tất cả các kênh, giảm bằng cách này, chi phí
tính toán và đồ tạo tác màu tránh đặt màu nguyên gốc trong lƣới mở rộng tại các
địa điểm (2i, 2j) Chèn điểm ảnh tại các địa điểm (2i +1, 2j+1) với phƣơng pháp
FCBI áp dụng lặp đi lặp lại điều chỉnh cho đến khi sự thay đổi hình ảnh trên một
ngƣỡng hoặc số lần lặp lại tối đa đạt đƣợc. Chèn điểm ảnh trong các địa điểm
còn lại với phƣơng pháp FCBI áp dụng lặp đi lặp lại 4 điều chỉnh để các điểm
ảnh tăng. Lặp lại toàn bộ thủ tục về hình ảnh mới cho to hơn nữa.
15
Vậy việc xây dựng DEM lƣới, hai phần của giải pháp đề xuất bao gồm cả
thế hệ sơ đồ Voronoi và các truy vấn lƣới, đáng kể tốt hơn NNI cho lƣới điện
dựa trên NNI DEM xây dựng.
2.2 Nội suy tuyến tính (Linear interpolation)
Nội suy là một phƣơng pháp xác định giá trị của một điểm dữ liệu không
rõ dựa trên các giá trị của các điểm dữ liệu đƣợc biết xung quanh. Nội suy tuyến
tính là một phƣơng pháp nội suy đơn giản, cho rằng một đƣờng thẳng (tuyến
tính) mối quan hệ giữa các điểm đã biết, về cơ bản nó có nghĩa là trung bình hai
16
,x2[k]) y[k]
1
(1,1)
2
2
(2,3)
2
3
(2,5)
5
4
(4,2)
1
5
(5,5)
số, ví dụ hàm Gaussian có chiều rộng của đƣờng cong nhƣ một tham số. Số
lƣợng lớn các RBF có sẵn và các thông số khác nhau của họ, làm cho nội suy
RBF rất linh hoạt.
17
2.3.1 Khái quát về hàm cơ sở bán kính RBF
Muốn khắc phục những hạn chế của ma trận khoảng cách nội suy, nhƣng
giữ cấu trúc tổng thể ta kết hợp tính toán ma trận khoảng cách với các hàm cơ
bản tốt.
Định nghĩa: Hàm Φ: Rs R đƣợc gọi là hàm bán kính nếu tồn tại hàm
đơn biến φ: [0, +∞) R Thỏa mãn:
( X ) (r )
(2.47)
Với
r x
Và ||.|| là một số chỉ tiêu trên Rs, thƣờng chỉ tiêu Euclide. Hàm φ tƣơng
ứng gọi là hàm cơ sở bán kính.
Nhƣ vậy cho một hàm bán kính
||X1|| = ||X2|| (X1) = (X2), X1, X2 RS
(2.48)
2.3.2 Các thuộc tính của hàm cơ sở bán kính RBF
Bất biến theo tất cả các biến đổi Euclide (tức là, bản dịch, quay, và phản
xạ). Nó không quan trọng cho dù lần đầu tiên tính toán RBF sau đó áp dụng
cách chuyển Euclide, hoặc nếu lần đầu tiên chuyển đổi dữ liệu. Thật sự kể từ
x N x 1 2 x N x 2
2
2
2
x 1 x N
x 2 x N
x N x N
C1 f ( x 1 )
C f (x )
2
ứng dụng cài đặt. Bài toán sử dụng phƣơng pháp nội suy ảnh để biểu diễn trạng
thái hoạt hóa của khuôn mặt. Biểu diễn khuôn mặt là quan trọng và cần thiết
cho bất kỳ hệ thống xử lý tƣơng tác nào nhƣ các chƣơng trình huấn luyện, biểu
thị thông tin, chữa bệnh, giáo dục, giải trí…Nhiệm vụ của hệ thống thể hiện
khuôn mặt nhằm biểu thị sinh động tính hoạt ảnh, từ đó mô phỏng chính xác,
sinh động thế giới thực, rút trích ra những tri thức hữu ích phục vụ thực tiến.
Đầu vào: Mô hình mặt 3D ở trạng thái mặt cân bằng và trạng thái tâm
lý đích cần biểu diễn
Đầu ra: Hình ảnh chuyển hóa khuôn mặt 3D từ trạng thái cân bằng
sang trạng thái tâm lý đích đã lựa chọn ở đầu vào
3.2 Phân tích bài toán
Thực chất của quá trình hoạt hóa mặt, đó là hoạt hóa các thành phần mô
phỏng khuôn mặt. Chúng ta sẽ áp dụng để xây dựng khung hình cho mặt, quá
trình hoạt hóa khuôn mặt là quá trình biến đổi các khung hình phù hợp theo thời
gian, cách làm này cho phép chúng ta tạo nên những thể hiện đa dạng trong
cùng một trạng thái cảm xúc, quá trình quan sát và biến đổi sẽ thực tế hơn. Quá
trình hoạt hóa mặt đƣợc biến đổi từ trạng thái tự nhiên sang trạng thái đích,
đứng trên một phƣơng diện nào đó thì các trạng thái làm trơn đều có thể coi là
trạng thái đích vì nó phù hợp với đa dạng nét mặt trong thực tế.
Bài toán biểu diễn trạng thái khuôn mặt dựa bao gồm những vấn đề chính
đó là:
Bƣớc 1: Xây dựng mô hình hóa khuôn mặt bằng mô hình 3D.
Bƣớc 2: Hoạt hóa khuôn mặt thể hiện trạng thái biểu cảm, bằng các cử
động của vùng đặc trƣng.
Nhƣ vậy đầu vào của bài toán là mô hình khuôn mặt 3D chƣơng trình có
nhiệm vụ tác động lên mô hình này để tạo nên sự hoạt ảnh 3D thể hiện đƣợc nét
mặt dựa trên những đặt trƣng rõ nhất của cảm xúc nét mặt.
20
trình sẽ tuân thủ những yêu cầu đã đề cập.
23
KẾT LUẬN
Kỹ thuật nội suy ảnh xử dụng nhiều trong các lĩnh vực công nghệ thông
tin để thúc đẩy sự phát triển nhiều lĩnh vực xã hội nhƣ y học, giáo dục, quân
sự, giải trí, mô hình ảo, kỹ thuật số,....Mà nhu cầu xử lý ảnh ngày càng cao.
Trên thế giới, kỹ thuật nội suy ảnh đã xử dụng nhiều trong việc tiến hành xây
dựng các mô hình nhân vật ảo tạo tiền đề cho phát triển đáp ứng nhu cầu của
cuộc sống con ngƣời ngày càng cao. Tuy nhiên, hiện nay ở Việt Nam vấn đề
này vẫn còn khá mới mẻ.
Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài ''Nghiên cứu một
số kỹ thuật nội suy ảnh'' có ý nghĩa khoa học và mang tính thực tiễn cao trong
hoàn cảnh Việt Nam chƣa có nhiều hệ thống xử lý ảnh mà thực tế đang đặt ra.
Luận Văn đã đạt đƣợc các kết quả sau:
Khái quát về xử lý ảnh và nội suy ảnh.
Một số kỹ thuật nội suy ảnh.
Cài đặt thử nghiệm chƣơng trình thể hiện trạng thái khuôn mặt dựa
vào kỹ thuật nội suy ảnh.