Thủy vân số và ứng dụng trong xác thực nội dung ảnh số Đào Trung Dũng. - Pdf 24


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN&TRUYỀN THÔNG
.

ĐÀO TRUNG DŨNG

THỦY VÂN SỐ VÀ ỨNG DỤNG
TRONG XÁC THỰC NỘI DUNG ẢNH SỐ

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên - 2014
Thái Nguyên - 2014

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

3

MỞ ĐẦU
Lí do chọn đề tài
Chúng ta đang sống trong một xã hội thông tin, đặc trưng lớn nhất đó là
sự thâm nhập của các loại dữ liệu số vào mọi mặt của đời sống xã hội. Dữ liệu
số có thể lưu trữ với chất lượng cao, có thể được xử lý một cách dễ dàng. Mặt
khác, cùng với sự phát triển mạnh mẽ của mạng Internet quá trình phân phối
các sản phẩm kỹ thuật số trở nên thuận tiện và nhanh chóng, thì vấn đề bảo vệ
bản quyền, quyền sở hữu trí tuệ, hạn chế truy nhập thông tin trái phép, xác thực
dữ liệu số, ngày càng trở lên quan trọng và là yêu cầu cấp thiết đặt ra trong
bối cảnh hiện nay, bởi vì dữ liệu số có những đặc trưng riêng như:
- Dễ dàng sao chép, chỉnh sửa: Chỉ cần một vài thao tác đơn giản trên
máy tính, mạng máy tính thì một tài liệu dày hàng nghìn trang hay một tác
phẩm nghệ thuật (bức tranh, ảnh, bản nhạc, logo,…) giá trị được sao chép chỉ
trong vòng vài giây. Điều quan trọng là khi sao chép thì chất lượng bản sao
được giữ nguyên so với bản gốc, giống tài liệu gốc và dễ dàng chỉnh sửa.
- Dễ dàng tìm kiếm: Với sự ra đời và ứng dụng mạnh mẽ mạng máy
tính internet thì việc xây dựng các ứng dụng và các kho dữ liệu số trên tất cả
các lĩnh vực của đời sống như: văn hóa, chính trị, kinh tế, quân sự, an ninh,
quốc phòng, dữ liệu bản đồ,… cùng với nhiều công cụ tìm kiếm dữ liệu đã giúp
cho việc tìm kiếm các loại dữ liệu số trở nên nhanh chóng hơn.
- Dễ dàng phát tán: Ngày nay một người sử dụng bình thường có thể trở
thành nguồn phát tán tài liệu dễ dàng thông qua các ứng dụng, phương tiện kỹ

Chƣơng 2. Một số kỹ thuật thủy vân trên ảnh số ứng dụng trong
xác thực nội dung ảnh số. Chương này tập trung trình bày về hướng tiếp cận
chính của thủy vân; các biến đổi thường dùng trên ảnh số như DFT, DCT,
DWT… một số kỹ thuật tiêu biểu thủy vân ảnh số trên miền không gian và
miền tần số.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

5
Chƣơng 3: Ứng dụng thủy vân để xác thực nội dung nhãn hiệu
quảng cáo trực tuyến. Phân tích các hình thức quảng cáo trong đó có hình
thức quảng cáo trực tuyến. Đề xuất giải pháp, mô hình sử dụng thủy vân để xác
thực hình ảnh quảng cáo trực tuyến. Ứng dụng bộ chương trình Visual Studio
2010, ngôn ngữ C# để lập trình ứng dụng kỹ thuật thủy vân hợp ảnh để thực
hiện bài toán trên.
Đối tƣợng và phạm vi nghiên cứu:
Tập trung vào tìm hiểu tổng quan về ảnh số, vấn đề giấu thông tin, thủy
vân trên ảnh số. Trong đó xác định hướng tiếp cận chính của thủy vân, một số
kỹ thuật, thuật toán thuỷ vân và ứng dụng trong xác nội dung ảnh số.
Hƣớng nghiên cứu của đề tài:
Tổng quan về ảnh số. Tổng quan vấn đề giấu thông tin. Một số kỹ
thuật, thuật toán thuỷ vân; cài đặt chương trình ứng dụng kỹ thuật thuỷ vân để
xác thực nhãn hiệu quảng cáo trực tuyến.
Phƣơng pháp nghiên cứu:
Sử dụng các phương pháp nghiên cứu chính sau: Phương pháp nghiên
cứu lý thuyết, thực nghiệm; Phân tích, so sánh các thuật toán giấu tin; Phương
pháp trao đổi khoa học, lấy ý kiến chuyên gia; Thử nghiệm các thuật toán trên
máy tính.
Ý nghĩa khoa học của đề tài:
Nghiên cứu, phân tích một số thuật toán thuỷ vân và xây dựng mô hình

thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic
Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *
200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

7
hơn màn hình CGA 17” độ phân giải 320*200. Lý do: cùng mật độ nhưng diện
tích màn hình rộng hơn thì độ mịn của các điểm ảnh thấp hơn.
1.1.3. Mức xám của ảnh
Một điểm ảnh có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ
xám của nó. Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng
giá trị số tại điểm đó.
- Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức
256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 01 byte (8 bit) để biểu
diễn mức xám: Mức xám dùng 01 byte biểu diễn: 2
8
=256 mức, từ 0 đến 255).
- Ảnh đen trắng: Là ảnh có hai màu đen, trắng (không chứa màu khác)
với mức xám ở các điểm ảnh có thể khác nhau.
- Ảnh nhị phân: Ảnh chỉ có 02 mức đen trắng phân biệt tức dùng 01 bit
mô tả 2
1
mức khác nhau. Nói cách khác, mỗi điểm ảnh của ảnh nhị phân chỉ có
thể là 0 hoặc 1.
- Ảnh màu: Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để
tạo nên thế giới màu, người ta thường dùng 03 byte để mô tả mức màu, khi đó
các giá trị màu: 2

ảnh, hay tổng số bít sử dụng cho mỗi pixel. Thí dụ với 8 bit biểu diễn điểm ảnh
thì có tới 255 mức cường độ khác nhau có thể biểu diễn.
Tóm lại, ảnh đa mức xám được biểu diễn bằng mảng 2 chiều. Mỗi phần
tử của mảng tương ứng với 01 điểm ảnh.
Việc sắp xếp các giá trị pixel này trong vùng bộ nhớ liên tục được gọi là
bitmap. Khái niệm này xuất phát từ ánh xạ (map) các pixel ảnh vật lý vào các
địa chỉ liên tục trong bộ nhớ. Bộ nhớ sử dụng để lưu trữ dữ liệu ảnh bitmap
được gọi là “frame buffer”.
Biểu diễn ảnh màu
Ảnh màu cũng bao gồm trường chữ nhật các pixel. Khác biệt với các ảnh
đa cấp xám là cần 3 giá trị để biểu diễn ảnh. Mỗi giá trị biểu diễn một màu cơ
sở. Cách biểu diễn này xuất phát từ lý thuyết rằng màu có thể hình thành từ
trộn ba màu cơ sở. Các màu cơ sở sử dụng trong vô tuyến truyền hình và màn
hình máy tính là Red, Green và Blue.
Ảnh màu có thể biểu diễn bởi ba mảng hai chiều tương ứng với các màu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9
cơ sở Red, Green và Blue của ảnh.

Màu và mô hình màu
Màu là phân bổ bước sóng ánh sáng (màu blue - 440 nm, màu green -
545 nm và màu red - 580 nm). Mắt người cảm nhận ba màu red, green và blue
nhờ các tế bào hình nón (khoảng 6-7 triệu) trên võng mạc. Mắt người cảm nhận
màu (bước sóng điện từ) trong dải từ 400 nm đến 700 nm.
Phần lớn màu sắc xung quanh ta không có bước sóng đơn mà chúng được
tạo bởi do trộn nhiều bước sóng khác nhau, mắt người nhạy với bước sóng trội.
Mô hình màu là mô hình toán học trừu tượng mô tả cách biểu diễn màu
mà con người có thể nhận biết bởi bộ các giá trị (thông thường là 3 hay 4 giá

hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được nhiều
và quan trọng là người khác khó phát hiện được một đối tượng có bị giấu tin
bên trong hay không. Khuynh hướng thứ hai là thuỷ vân số (watermarking).
Khuynh hướng thuỷ vân số đánh giấu vào đối tượng nhằm khẳng định bản
quyền sở hữu hay phát hiện xuyên tạc thông tin. Thuỷ vân số có miền ứng dụng
lớn hơn nên được quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những
kỹ thuật dành cho khuynh hướng này.
Hình 1.1 dưới đây phân loại các kỹ thuật giấu tin dưới đây chia ra các
lĩnh vực của giấu tin. Có thể chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là
watermarking và steganography. Nếu như watermarking quan tâm nhiều đến
các ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững cao của thông
tin cần giấu đối với các biến đổi thông thường của tệp dữ liệu môi trường thì
steganography lại quan tâm tới các ứng dụng che giấu các bản tin với độ mật và
dung lượng càng lớn càng tốt. Đối với từng hướng lớn này, quá trình phân loại
có thể tiếp tục theo các tiêu chí khác, ví dụ dựa theo ảnh hưởng các tác động từ
bên ngoài có thể chia watermark thành hai loại, một loại bền vững với các tác

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11
Information hiding
Giấu thông tin
Robust
Watermarking
Thuỷ vân bền vững
Steganography
Giấu tin mật
Fragile
Watermarking
Thuỷ vân “dễ vỡ”

- Thông tin được giấu phải ẩn, không
cho người khác thấy được bằng mắt
thường.
- Chỉ tiêu quan trọng nhất là dung
- Mục đích bảo vệ môi trường giấu tin.
- Chỉ cần thông tin đủ để đặc trưng cho
bản quyền của chủ sở hữu.
- Thông tin giấu có thể ẩn (thủy vân
ẩn) hoặc hiện (thủy vân hiện).

- Chỉ tiêu quan trọng nhất là tính bền

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

12
lượng của tin được giấu
vững của tin được giấu.

Có nhiều cách để tiến hành phân loại các phương pháp giấu thông tin
theo các tiêu chí khác nhau, như theo các phương tiện chứa tin, các phương
pháp tác động lên phương tiện chứa tin, hay phân loại theo ứng dụng, cụ thể:
- Phân loại theo phương tiện chứa tin:
+ Giấu thông tin trong ảnh.
+ Giấu thông tin trong các file âm thanh.
+ Giấu thông tin trong video.
+ Giấu thông tin trong văn bản dạng text.
- Phân loại theo cách thức tác động lên phương tiện:
+ Phương pháp chèn dữ liệu: Tìm vị trí trong file dễ bị bỏ qua, và chèn
các dữ liệu cần giấu vào đó (ví dụ: dữ liệu được giấu sau các ký tự EOF).
+ Phương pháp thay thế: Thay thế các phần tử không quan trọng của

Tổng quát hóa quá trình thực hiện như sau:
- Giấu tin: M + F + K → F’
- Giải mã tin giấu: F’ + K → M + F
Trong đó:
M- Thông tin cần giấu, F - vật mang (ảnh, audio, video,. . .), K - một
hoặc nhiều khóa tùy thuộc và ứng dụng, F’ - vật mang chứa thông tin giấu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

14

Hình 1.2. Mô hình của quá trình giấu tin 1.3. THỦY VÂN SỐ
1.3.1. Khái niệm
Thủy vân không phải là một kỹ thuật mới. Nó là một nhánh của kỹ thuật
ẩn giấu tin đã tồn tại vài trăm năm trước. Ẩn giấu tin là một kỹ thuật sử dụng
cho việc truyền các thông tin mật. Thông điệp được truyền ở đây là một bí mật
mà sự tồn tại của nó là chỉ được biết đến bởi các bên liên quan trong giao tiếp.
Hình 1.3. Mô hình của quá trình giải mã tin giấu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

15
Như vậy, có thể định nghĩa, “thủy vân số” là quá trình đó nhúng những
dữ liệu (được gọi là “thủy vân” - watermark) vào một đối tượng đa phương tiện
theo một cách nào đó, để sau đó có thể phát hiện hoặc trích xuất “thủy vân” cho
mục đích xác thực nguồn gốc sản phẩm [16]. “Thủy vân” là một phần đặc

- Tính bền vững:
Hình ảnh được thủy vân có thể phải trải qua nhiều
loại xử lý biến đổi khác nhau, ví dụ, tăng độ tương phản ảnh, lọc thông, làm
mờ Do vậy, dấu thủy vân phải có tính bền vững chịu được các phép biến
đổi ảnh cũng như biến đổi tín hiệu số thành tín hiệu tương tự, tương tự thành
số và nén Ngoài ra, ảnh chứa thủy vân phải chịu được các phép biến đổi
hình học như di chuyển vị trí, co giãn kích thước và cắt xén. Thủy vân đạt
được tính bền vững thực sự khi dấu thủy vân vẫn còn trong dữ liệu sau khi
biến đổi và bộ phát hiện/trích xuất vẫn có thể phát hiện ra thủy vân. Ví dụ:
Dấu thủy vân vẫn tồn tại trong ảnh sau phép biến đổi hình học nhưng thuật
toán phát hiện/trích xuất chỉ phát hiện và đưa ra thủy vân sau khi loại bỏ
phép biến đổi. Trong trường hợp, không xác định rõ phép biến đổi để thực
hiện biến đổi ngược thì bộ phát hiện/trích xuất không thể phát hiện và đưa ra
thủy vân mặc dù thủy vân vẫn còn tồn tại trong ảnh số.
Thủy
vân
có thể được nhúng trong hình ảnh bằng cách thay đổi các giá
trị điểm ảnh. Trong trường hợp biến đổi miền không gian, thủy
vân
đơn giản
có thể được nhúng vào trong ảnh bằng cách thay đổi các giá trị điểm ảnh hoặc
giá trị các bit ít quan trọng nhất (LSB, CPT). Tuy nhiên, thủy
vân
bền vững
hơn nếu được nhúng vào trong miền biến đổi của hình ảnh bằng cách thay đổi
các hệ số.

Tính bền vững được hiểu tùy vào mục đích của từng lại thủy vân, ví dụ
với thủy vân dùng để bảo vệ bản quyền, thì thủy vân phải bền với các phép tấn
công hay biến đổi, trong khi với thủy vân dùng để chống xuyên tạc hoặc đảm
Theo không gian xử lý

Theo kiểu tài liệu

Theo tri giác

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

18 Tùy theo từng tiêu chí phân loại mà “Thủy vân” có thể được chia thành
nhiều loại khác nhau [8]. Một trong những tiêu chí để phân loại là “miền
nhúng” là nơi chứa “thủy vân” khi thực hiện kĩ thuật “thủy vân”. Thủy vân
được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng
dụng những kỹ thuật đó.
- Nếu phân biệt theo vùng làm việc thì có thể phân loại theo kỹ thuật
thủy vân theo miền không gian hoặc thủy vân theo miền tần số.
- Nếu phân loại theo kiểu dữ liệu thì có thể phân loại thủy vân trong text,

ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu
tượng kênh chương trình vô tuyến mà chúng ta thường thấy như: VTV1,
VTV3, TTV… Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc
trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc. Đối với thuỷ vân
hiện, thông tin bản quyền hiển thị ngay trên sản phẩm.
1.3.4. Quy trình tạo thủy vân

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

20

Hình 1.5. Mô hình hệ thống thuỷ vân ảnh số
Quá trình liên quan đến xử lý thuỷ vân cơ bản gồm 04 bước chính như
sau [13]:
* Bước 1 - Tạo thuỷ vân
Thuỷ vân có thể là một logo hay dãy nhị phân với độ dài cho trước.
Thủy vân dạng ảnh có khả năng chống chịu trước các phép xử lý ảnh tốt hơn
nhiều hơn so với thủy vân dạng ký tự. Thuỷ vân có thể được biến đổi (bằng mã
hoá, chuyển đổi định dạng), trước khi dấu vào ảnh. Các thuật toán nhúng thuỷ
vân là một logo được gọi là thuật toán thuỷ vân hợp nhất ảnh (image-fusion).
Thuỷ vân dạng ảnh có lợi ích là dễ dàng nhận biết về mặt trực giác và đưa ra
một chứng minh đúng đắn về quyền sở hữu ảnh. Bình thường sẽ có một khoá bí
mật K dùng để tăng tính bảo mật cho dữ liệu được nhúng. Do tính bền vững
được đảm bảo hơn nên thủy vân dạng ảnh được sử dụng nhiều hơn.
Để tăng thêm tính an toàn và dung lượng, thì thủy vân trước khi nhúng
vào ảnh mang có thể được mã hóa hay nén lại. Theo cơ chế này, đầu tiên thủy
vân số sẽ được nén lại để lượng dữ liệu thủy vân có thể tăng lên, sau đó được

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Để tách thuỷ vân ra khỏi ảnh, ta sẽ dùng khoá K trong quá trình nhúng,
và ảnh cần tách thuỷ vân. Thuật toán tách thuỷ vân có các bước ngược với thuật
toán nhúng ở trên.
* Bước 4- Phát hiện thuỷ vân và giải mã
Đối với thuỷ vân là một logo thì sau khi giải mã, việc xác định thuỷ vân
có tồn tại hay không là đơn giản. Còn nếu thuỷ vân là một dãy số có phân bố
Gauss thì có thể dựa vào kiểu tương quan, kiểu phân bố của dãy số thu được để
đánh giá sự tồn tại thuỷ vân.
Đối với ứng dụng nhằm xác thực ảnh thì cần phải xác định xem là có
thuỷ vân hay không. Điều này dẫn đến mô hình kiểm chứng giả thiết và hiệu
quả của hệ thống thuỷ vân có thể được đánh giá theo thuật ngữ lỗi loại I và lỗi
loại II. Lỗi loại I ứng với trường hợp thuỷ vân được tìm thấy mặc dù nó không
tồn tại. Còn lỗi loại II ứng với trường hợp thuỷ vân tồn tại nhưng không tìm
thấy. Cơ chế thuỷ vân cho các ứng dụng xác thực ảnh hoặc bảo toàn dữ liệu thì
đưa ra câu trả lời có/không về việc ảnh có bị giả mạo, thay đổi, đưa ra xác định
về nguồn dữ liệu hợp pháp hoặc chỉ ra các vùng dữ liệu đã bị thay đổi.
1.3.5. Nội dung thủy vân
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu vào
bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các ký tự mã ASCII,
chuỗi kí tự được nhúng trực tiếp lên ảnh mang những thông tin như tác giả, tiêu
đề hay ngày tháng…Tuy nhiên, chuỗi ký tự mã ASCII lại bị một hạn chế đó là
mỗi ký tự biểu diễn bằng nhiều bít nếu vì một lí do nào đó một bít bị lỗi thì sẽ
làm sai cả kí tự và có thể làm cho thuỷ vân bị sai lệch rất nhiều.
Chúng ta cũng có thể dùng ảnh để giấu, khi đó ta sẽ có ảnh trong ảnh.
Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ được giữ
nguyên. Do đó khi lựa chọn ảnh làm thuỷ vân phải lựa chọn những bức ảnh đơn
giản, dễ nhận dạng như logo,

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



24
* Bảo vệ bản quyền (copyright protection)
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số (digital
watermarking) - một dạng của phương pháp giấu tin. Một thông tin nào đó
mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ
được nhúng vào trong các sản phẩm. Thuỷ vân đó chỉ một mình người chủ sở
hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản
quyền sản phẩm. Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như
ảnh, âm thanh, video cần được lưu thông trên mạng. Để bảo vệ các sản phẩm
chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán
tem bản quyền” vào sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ
vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận
sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền
vững cùng với sản phẩm
* Xác thực thông tin hay phát hiện xuyên tạc thông tin (tamper
detection and authentication)
Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được
sử dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay
không. Các thuỷ vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa
việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được
xem xét. Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị
xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một
đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội
dung hay là chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng này là
khả năng giấu thông tin nhiều và thuỷ vân không cần bền vững trước các phép
xử lý trên đối tượng đã được giấu tin.
* Giấu tin mật (steganography)

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status