HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Phạm Thị Lương
NGHIÊN CỨU SỬ DỤNG WAVELET TRONG THỦY VÂN ẢNH SỐ
Chuyên ngành: Kỹ thuật viễn thông
Mã số: 60.52.0.80
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS. TS. Lê Hữu Lập
Phản biện 1: ……………………………………………………………………………
Phản biện 2: …………………………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
24
KẾT LUẬN
Thuỷ vân đang là một lĩnh vực được quan tâm và nghiên
cứu trên toàn thế giới, trong khuân khổ luận văn này tác giả đã
nghiên cứu về kỹ thuật thuỷ vân ảnh số dựa vào phép biến đổi
sóng nhỏ rời rạc. Tác giả đã thu thập, khảo sát và tiến hành xây
dựng cài đặt chương trình thử nghiệm chương trình kỹ thuật thuỷ
vân trên Matlab. Đây là một công cụ hỗ trợ mạnh cho việc xử lý
ảnh. Chương trình đã sử dụng thuật toán nhúng được thông tin
vào trong một file ảnh và lấy thông tin từ các file ảnh có chứa
thông tin trong đó. Thông tin được giấu là một bức ảnh có tác dụng
bảo vệ bản quyền. Từ đó chúng ta có cái nhìn thực nghiệm về kết
quả của thuật toán để có những đánh giá, so sánh tốt hơn.
minh chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ
liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu
thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi lấy cắp
hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào
sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần
phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận
sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải
tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà
không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ
sản phẩm.
Trên cơ sở đó, cùng với sự hướng dẫn tận tình của GS.TSKH
Nguyễn Ngọc San, tôi đã tiến hành tìm hiểu, nghiên cứu và hoàn
thành luận văn với đề tài: “NGHIÊN CỨU SỬ DỤNG WAVELET
TRONG THỦY VÂN ẢNH SỐ“. Kết quả nghiên cứu được chương
mục hóa trong phần nội dung như sau:
2
Chương 1. Giới thiệu tổng quan về lịch sử hình thành và
phát triển của
thủy vân số, khái niệm, các đặc tính của thủy vân số và phương pháp
tiếp cận lĩnh vực thủy vân số.
Chương 2. Tập trung vào cơ sở lý thuyết và thuật toán thủy
vân ảnh số sử dụng phép biến đổi Wavelet.
Chương 3. Trình bày các ứng dụng tiêu biểu của thủy vân số
đang được quan tâm nhiều.
Chương 4. Trình bày chương trình thực nghiệm mô phỏng
thuật toán dựa trên Mablab.
Chương 1 - TỔNG QUAN VỀ THỦY VÂN ẢNH SỐ
1.1 Giới thiệu chương
Trong chương này, luận văn sẽ trình bày những vấn đề tổng quan
về thủy vân số, bao gồm: Lịch sử ra đời, khái niệm và so sánh thủy
Nhìn chung kỹ thuật thuỷ vân trong miền DWT tuy mất
nhiều thời gian nhưng mức độ cảm thụ vẫn chấp nhận được và bền
vững hơn so với kỹ thuật thuỷ vân DCT (thuỷ vân tìm lại rõ nét
hơn). Vì vậy với những mục đích của việc thuỷ vân trên ảnh đã
được đưa ra trong phần đầu thì kỹ thuật thuỷ vân trong miền
DWT nên được sử dụng.
4.5 Kết luận chương
22
- Thời gian thực hiện: 13.0885 s
Hệ số nhúng k = 20
- Thời gian thực hiện: 6.9576 s
- SNR Signal to Noise Ratio: 2.2571 db
- PSNR Peak Signal to Noise Ratio: 7.5664 db
- Thời gian thực hiện: 12.4333 s
3
Cùng với sự bùng nổ của công nghệ thông tin, đặc biệt là sự
bùng nổ của Internet và các phương tiện multimedia mang lại nhiều
thuận lợi nhưng lại xẩy ra những vẫn nạn như ăn cắp bản quyền,
xuyên tạc thông tin, truy cập thông tin trái phép… gia tăng, đòi hỏi
không ngừng phải tìm các giải pháp mới đảm bảo cho sự an toàn và
bảo mật thông tin.
Nhiều phương pháp bảo vệ thông tin đã được đưa ra trong đó
giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Thông tin ban
đầu được mã hoá và gửi đi, người nhận được sẽ giải mã thông tin nhờ
khoá của hệ mật mã. Có nhiều hệ mã phức tạp được sử dụng như
DES, RSA, NAPSACK…mang lại hiệu quả cao. Bên cạnh đó, một
phương pháp được sử dụng mang lại nhiều lợi ích tối ưu đó là kỹ
thuật giấu tin (DataHiding).
Có thể coi giấu tin là một nhánh của ngành mật mã với mục
tiêu là nghiên cứu các phương pháp che giấu thông tin mật.
Thủy vân số (Digital Watermarking) là kỹ thuật nhúng “dấu
ấn số” (Watermark – tin giấu) vào một sản phẩm số (text, image,
audio, video), mà tin giấu này có thể được phát hiện và tách ra sau
đó, nhằm chứng thực (đánh dấu, xác thực) nguồn gốc hay chủ sở hữu
của sản phầm số này.
So sánh thủy vân số với giấu tin mật
Mặc dù thủy vân số (Watermarking) và giấu tin mật
(steganography) cùng nằm trong lĩnh vực nghiên cứu nhằm che dấu
đi sự hiện diện của thông tin nhưng chúng có một số đặc điểm khác
biệt:
Steganography
Watermarking
- Mục đích là bảo vệ thông tin
được giấu.
- Giấu được càng nhiều thông
tin càng tốt, ứng dụng trong
truyền dữ liệu thông tin mật.
- Thông tin được giấu phải ẩn,
không cho người khác thấy
được bằng mắt thường.
- Chỉ tiêu quan trọng nhất là
- Mục đích là bảo vệ môi
trường giấu tin.
- Chỉ cần thông tin đủ để đặc
trưng cho bản quyền của chủ
sở hữu.
- Thông tin giấu có thể ẩn
(invisible Watermarking) hoặc
hiện (visible Watermarking).
21
- Hệ số nhúng đã sử dụng
-
5
dung lượng của tin được giấu.
- Chỉ tiêu quan trọng nhất là
tính bền vững của tin được
giấu.
1.2.3 Nguồn gốc thủy vân số
Thủy vân trên giấy (paper Watermark): Thủy vân trên giấy
xuất hiện trong ngành sản xuất giấy cách đây hơn 700 năm. Thủy vân
trên giấy (paper Watermark) đầu tiên được tìm thấy có nguồn gốc từ
Fabriano, Italy.
Thủy vân số (digital Watermark): Khái niệm thủy vân số cũng
xuất phát từ khái niệm thủy vân trên giấy. Tuy nhiên, thật khó để nói
chính xác khi nào khái niệm “thủy vân số” (digital Watermarking)
bắt đầu được nói đến. Năm 1979, Szepanski mô tả một mẫu thông tin
số có thể nhúng vào tài liệu nhằm mục đích chống giả mạo. Chín
năm sau, Holt và các đồng nghiệp mô tả một phương pháp để nhúng
mã định danh vào tín hiệu âm thanh. Tuy nhiên, mãi đến năm 1988,
Komatsu và Tominaga mới lần đầu tiên sử dụng cụm từ “digital
Watermark”. Nhưng phải đến đầu những năm 90 thì thủy vân số với
thực sự nhận được sự quan tâm của công chúng.
1.2.4. Phân loại thủy vân số
Có rất nhiều cách phân loại thủy vân số khác nhau:
Theo khả năng cảm nhận, người ta phân thành hai loại thủy vân
số sau:
- Visible/Perceptible (hữu hình)
- Invisible (vô hình)
Theo tính bền vững, ta có ba loại thủy vân số như sau:
- Robust Watermarking:
thuật mà người ta
phân loại các kỹ thuật thuỷ vân như sau:
Hình1-10: Phân loại các kỹ thuật thuỷ vân
1.3 Yêu cầu và các đặc tính của thủy vân số
Tùy theo mỗi loại thủy vân, các yêu cầu với chúng cũng có
một số điểm khác biệt:
1.3.1 Tính bền vững
Đây là tính chất quan trọng nhất của hệ thuỷ vân bền vững.
Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay
tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân. Nhìn
chung, một thủy vân phải bền vững với các phép biến đổi như
chuyển đổi tín hiệu A/D (analog to digital – tín hiệu tương tự sang tín
hiệu số) và D/A, các phép nén mất dữ liệu, in, quét, nhiễu trên đường
truyền. Với ảnh nói riêng, thủy vân phải bền vững với các phép biến
19
3.2.2 Điều khiển và ngăn chặn sao chép
Ta biết rằng sẽ tốt hơn nếu ngăn ngay từ đầu những hành vi
bất hợp pháp như sao chép dữ liệu mà không được phép, như vậy nếu
có một ứng dụng kiểm soát sao chép ngăn chặn sẽ không cho tạo ra
các bản sao bất hợp pháp từ nội dung đã có bản quyền.
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này.
Tài liệu được mã hóa với một khóa duy nhất, nếu không có khóa thì
không dùng được. Tuy nhiên khóa này được cung cấp theo kiểu khó
mà sao chép hay phân phối lại (nhằm hạn chế thấp nhất khả năng
khách hàng cho khóa của họ cho người khác xài miễn phí).
3.2.3 Chống giả mạo và gian lận
Một ứng dụng khác của thuỷ vân là xác thực ảnh và phát hiện
giả mạo. Ảnh số ngày càng được sử dụng như các bằng chứng quan
trọng trong điều tra của cảnh sát, bằng chứng trước pháp luật ngày
nay, sự giả mạo có thể gây ra nhiều vấn đề nghiêm trọng. Các tác
thời xa xưa với mục đích tương tự.
Do các Watermark có thể vừa không thể nhận thấy vừa
không thể tách rời tác phẩm chứa nó nên chúng là giải pháp tốt hơn
dòng chữ đối với việc nhận ra người sở hữu nếu người dùng tác
phẩm được cung cấp bộ dò Watermark. Digimarc cho ảnh là ứng
dụng mà ta đang đề cập. Nó được tích hợp vào Photoshop. Khi bộ dò
của Digimarc nhận ra một Watermark, nó liên lạc với cơ sở dữ liệu
trung tâm trên Internet và dùng thông điệp Watermark như một khóa
để tìm thông tin liên lạc cho người sở hữu ảnh. Tính hợp pháp của
một ứng dụng lương thiện dễ dàng tìm ra người họ muốn liên lạc để
dùng ảnh. Như vậy, nhúng thông tin của người giữ tác quyền của một
tác phẩm như là một Watermark.
Watermark không chỉ được dùng để chỉ ra thông tin tác
quyền mà còn được dùng để chứng minh tác quyền.
7
đổi hình học như phép dịch chuyển, co dãn, hoặc cắt xén. Phương
pháp thủy vân số phải đảm bảo sao cho việc không lấy lại được thủy
vân tương đương với việc ảnh đã bị biến đổi quá nhiều, không có giá
trị thương mại.
1.3.2 Tính bảo mật
Sau khi đã được thủy vân ảnh, thì yêu cầu là chỉ cho phép
những người có quyền sử dụng được chỉnh sửa và phát hiện được
thủy vân. Điều này được thực hiện nhờ vào khóa mã dùng làm
khóa trong giải thuật đưa thủy vân vào ảnh số và giải thuật phát
hiện ra thủy vân trong ảnh số.
1.3.3 Tính ẩn
Việc nhúng thông tin vào ảnh sẽ làm biến đổi ảnh ít hay nhiều.
Tính ẩn (trong loại thủy vân ẩn - invisible Watermarking) yêu cầu sự
biến đổi ảnh mang là nhỏ nhất có thể. Với các phương pháp thủy vân
số tốt sẽ làm cho thông tin được nhúng trở nên vô hình trong ảnh
triển nhằm mục đích bảo vệ bảo quyền ảnh số và xác minh tình trạng
nguyên vẹn dữ liệu. Hầu hết các thuật toán Watermarking đều
chuyển đổi ảnh gốc sang một miền mà thuận tiện cho việc nhúng
thông tin Watermark nhằm bảo đảm tính bền vững và không nhìn
thấy.
Có thể chia các kỹ thuật thuỷ vân theo hai hướng tiếp cận
chính:
Hướng thứ nhất dựa trên miền không gian ảnh tức là tiến
hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên
miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập
tự nhiên.
Hướng thứ hai là sử dụng các phương pháp khảo sát gián
tiếp khác thông qua các kỹ thuật biến đổi. Các kỹ thuật biến đổi này
làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và
như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền
mới với các biến số mới. Sau đó, tìm cách nhúng thuỷ vân vào ảnh
bằng cách thay đổi các hệ số biến đổi trong những miền thích hợp để
đảm bảo chất lượng ảnh và sự bền vững của thuỷ vân sau khi nhúng.
17
Ảnh sau khi thuỷ vân bị nhiễu nhiều hơn so với ảnh gốc
Qui trình tìm lại thuỷ vân
Hình 2-9: Quy trình tìm lại thủy vân
Input: Ảnh đã thủy vân
16
Một ảnh sau khi thuỷ vân, F’
Quy trình nhúng thủy vân
Đọc ảnh chủ, thủy vân và
khóa bí mật K
Dùng DWT, Phân tích ảnh chủ
Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi
cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn.
1.5 Các tấn công có thể lên hệ thống thủy vân ảnh số
Phương pháp thủy vân phải chống lại một số phép xử lý
ảnh thông thường (ví dụ như lỗi khi ảnh truyền đi, nén ảnh, ) và
một số tấn công có chủ đích nhằm xuyên tác, phá hoại bức ảnh.
Trong thực tế thì thủy vân phải cân đối giữa tính bền vững với
các tính chất khác như lượng thông tin dấu, tính ẩn…Dựa trên
yêu cầu thực tế của ứng dụng, người ta sẽ lựa chọn phương pháp
thủy vân thích hợp nhất.
Từ những biến đổi có chủ đích hay không có chủ đích đã
biết với thủy vân mà ta có thể phân biệt thành hai nhóm xuyên
tạc sau: Một là các biến đổi xem như là nhiễu với dữ liệu, hai là
10
làm mất tính đồng bộ để không thể lấy tin ra được.
Một vài phép biến đổi thường gặp:
- Biến đổi tín hiệu: Làm sắc nét, thay đổi độ tương phản,
màu,
- Nhiễu cộng, nhiễu nhân,….
- Lọc tuyến tính.
- Nén mất thông tin.
- Biến đổi affine cục bộ hoặc toàn cục.
- Giảm dữ liệu: Cropping, sửa histogram.
- Chuyển mã (gif Jpeg)
- Chuyển đổi tương tự - số
- Thuỷ vân nhiều lần.
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo
đủ tính bền vững sao cho các tấn công không làm cho giá trị
thương mại của ảnh gốc bị ảnh hưởng.
1.6 Các phương pháp tiếp cận nhằm tạo Watermarking có độ an
2.4 Thuật toán thủy vân ảnh số dựa vào phép biến đổi Wavelet
Mô tả thuật toán
Input:
o Một ảnh nhỏ được sử dụng làm thuỷ vân (kích thước
256 x 256)
oMột ảnh F cần nhúng thuỷ vân để bảo vệ bản quyền
oMột khoá bí mật để nhúng và giải thuỷ vân (khóa k)
Output:
14
Tương tự như các tín hiệu một chiều, các tín hiệu hai chiều
(tức là các bức ảnh) cũng có thể được phân tích tương tự bằng
DWT nhưng theo cả hai chiều dọc và ngang. Một bộ lọc tần số
thấp và một bộ lọc tần số cao sẽ được sử dụng kết hợp để lọc các
tín hiệu. Đầu tiên, ảnh gốc sẽ được lọc thấp theo chiều dọc. Sau
đó, nếu lọc lại bằng chính bộ lọc này theo chiều ngang ta sẽ có
băng LL và nếu lọc lại bằng bộ lọc cao ta sẽ có băng LH. Tiếp
theo, ảnh gốc sẽ được lọc cao theo chiều dọc và sau đó sẽ được
lọc lại theo chiều ngang bằng lọc thấp để có băng HL và bằng lọc
cao để có băng HH.
Quá trình trên lại có thể tiếp tục đối với băng LL để tạo
ra phép biến
đổi DWT hai mức như minh hoạ trong hình dưới đây:
LL2
HL2
HL1
LH2
HH2
LH1
HH1
Qúa trình tổng hợp ảnh gốc từ các bức ảnh xấp xỉ và chi tiết
cầu về tính an toàn đối với các kỹ thuật nén và tấn công Watermark
thì các phương pháp Watermark trên miền không gian tỏ ra rất yếu
kém. Các nghiên cứu gần đây cho thấy rằng các yêu cầu về tính vô
hình và độ an toàn của Watermark có thể được thực hiện dễ hơn nếu
sử dụng các biến đổi cho dữ liệu chủ, thông tin Watermark sẽ được
chứa nhiều trong miền biến đổi này.
Nhiều biến đổi ảnh đã được xem xét, nổi lên trong đó là biến
đổi cosine rời rạc (DCT). Trước đây biến đổi này đặc biệt ưa chuộng
cho các chuẩn mã hóa video và ảnh. Từ đó, một số lớn kỹ thuật
Watermarking đã tận dụng biến đổi này. Ngoài ra, còn có các biến
đổi khác cũng được đề nghị dùng trong kỹ thuật Watermarking bao
gồm biến đổi Fourier rời rạc (DFT), biến đổi Fourier-Mellin, …
Trong những tác phẩm mới đây nhất, các tác giả thường đề cập đến
việc dùng biến đổi Wavelet rời rạc (DWT) cho kỹ thuật
Watermarking.
12
Trong lĩnh vực ảnh số, cùng với trào lưu tiêu chuẩn hóa theo
JPEG2000 và dịch chuyển các phương pháp nén ảnh từ dựa trên
DCT sang DWT, các mô hình Watermark hoạt động trên miền
Wavelet ngày càng trở nên được quan tâm hơn. Các yêu cầu mới như
truyền tải từng phần và có tỉ lệ bit thấp, độ phân giải và tính có thể
thay đổi tỷ lệ chất lượng, khả năng phục hồi lỗi và mã hóa vùng quan
tâm (ROI), được đòi hỏi với hiệu suất mã hóa cao hơn và đa năng
hơn. Những yêu cầu này được đáp ứng nhờ vào hệ thống “mã hóa
khối được nhúng có làm tròn tối ưu” (EBCOT) dựa theo Wavelet,
điều này được chấp nhận với các bổ sung nhỏ trong chuẩn mã hóa
ảnh JPEG2000. Biến đổi Wavelet có một số thuận lợi hơn so với các
biến đổi khác, chẳng hạn DCT, là vì nó có thể triển khai trên cả hai
ứng dụng là nén ảnh và Watermarking.
2.2 Cơ sở toán học của phép biến đổi Wavelet
Tín hiệu được chia thành 2 phần, phần tần số cao và phần tần
số thấp. Đối với nhiều tín hiệu, phần nội dung có tần số thấp chứa
những thông tin quan trọng nhất - những đặc tính nhận dạng. Trái lại,
phần nội dung có tần số cao chỉ mang sắc thái của tín hiệu.
Quá trình phân tích và tổng hợp một tín hiệu có thể được
mô tả như sau:
Hình 2-2: Quá trình phân tích và tổng hợp tín hiệu
Quá trình này được gọi là phân tích một mức. Có thể lặp
lại quá trình này bằng cách tiếp tục phân tích tín hiệu xấp xỉ thành
hai tín hiệu ở giải tần thấp hơn. Từ đây xuất hiện một khái niệm
được gọi là phân tích nhiều mức.
Về mặt lý thuyết, quá trình này có thể lặp lại vô hạn. Tuy
nhiên, trong thực tế, việc phân tích chỉ có thể tiếp diễn cho đến
khi phần chi tiết chỉ còn một mẫu hay một điểm. Việc lựa chọn số
mức phân tích hoàn toàn phụ thuộc vào bản chất của tín hiệu.