TRƯỜNG ĐẠI HỌC ĐIỆN LỰC HÀ NỘI
KHOA ĐIỆN TỬ - VIỄN THÔNG
BÁO CÁO ĐỀ TÀI TIỂU LUẬN
MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Đề tài:
“Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện”
Giảng viên: TS. Đỗ Văn Tuấn
Nhóm sinh viên: Nguyễn Tuấn Bảo
Nguyễn Xuân Đoàn
Nguyễn Mạnh Hiếu
Nguyễn Thị Lộc
Nguyễn Tiến Trung
Nguyễn Quang Huy
Bùi Đình Thắng
Lớp: Đ6-ĐTVT2
Ngành: Điện Tử - Viễn Thông
Hà Nội, 05/2012
LỜI MỞ ĐẦU
Ngày nay, bên cạnh những ích lợi to lớn,
thiết thực mà mạng máy tính đem lại,
chúng ta cũng đang đối đầu với những thử thách liên quan đến các vấn đề truyền thông
bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa phương tiện sao cho bảo đảm quyền
sở hữu trí tuệ. Tình trạng sao chép bất hợp pháp, giả mạo các tác phẩm số hóa gây búc xúc
không chỉ riêng các tác giả mà còn cho cả những người làm pháp luật.
Những hành vi xâm
phạm bản quyền
như
giả mạo, ăn cắp tác phẩm, sử dụng các tác
phẩm
không có bản
Xin chân thành cảm ơn.
Nhóm sinh viên thực hiện
2
MỤC LỤC
3
CÁC HÌNH ẢNH
Hình 1 Sơ đồ chung của hệ thống nhúng Watermark…………………………………… 6
Hình 2: Bộ dò không cần ảnh gốc……………………………………………………… 20
Hình 3: Bộ dò cần ảnh gốc……………………………………………………………… 20
Hình 4: Mô hình Watermarking theo quan niệm truyền thông với thông
tin phụ ở bộ trung chuyển……………… ……………………………………………….21
Hình 5: Bộ dò trong mô hình Watermarking theo quan niệm hình học
trên không gian nhúng…………………………………………………………………….22
Hình 6: Bộ nhúng trong mô hình Watermarking theo quan niệm hình học trên không gian
nhúng………………………………………………………………………………… …23
4
CHƯƠNG 1. TỔNG QUAN VỀ WATERMARKING
Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại. Nó được định
nghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo đảm không cảm
thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc. Thông thường người ta chỉ đề cập đến
Watermarking số. Đó là một tập các dữ liệu số thứ cấp - gọi là Watermark (mã đánh dấu
bản quyền) - được nhúng vào dữ liệu số sơ cấp - gọi là dữ liệu bao phủ (ví dụ như văn bản,
hình ảnh, video và audio số, ). Dữ liệu sau quá trình nhúng được gọi là dữ liệu nhúng.
Tanaka (1990), Caronni và Tirkel (1993) lần lượt đưa ra những ấn bản đầu tiên về
Watermarking nhưng chưa nhận được sự quan tâm đúng mức. Mãi đến năm 1995, chủ đề
này mới bắt đầu được quan tâm và kể từ đó, Watermarking số đã phát triển rất nhanh với
nhiều hướng nghiên cứu và phương pháp thực hiện khác nhau.
Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều
khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, … trong đó ứng dụng
phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách
Watermarking với những mức độ khác nhau. Chẳng hạn CPTWG thử nghiệm hệ thống
Watermarking bảo vệ phim trên DVD. SDMI sử dụng Watermarking trong việc bảo vệ các
đoạn nhạc. Hai dự án khác được liên minh châu Âu ủng hộ, VIVA và Talisman đã thử nghiệm
sử dụng Watermarking để theo dõi phát sóng. Vào cuối thập niên 1990, một số công ty đưa
Watermarking vào thương trường, chẳng hạn các nhà phân phối nhạc trên internet sử dụng
Liqid Audio áp dụng công nghệ của Verance Corporation. Trong lĩnh vực Watermarking
ảnh, Photoshop đã tích hợp một bộ nhúng và bộ dò Watermark tên là Digimarc.
Ngày nay, các công ty chuyên kinh doanh các hệ thống Watermarking đã tăng đáng
kể, dưới đây là một số ví dụ về các công ty và sản phẩm trong lĩnh vực Watermarking:
Các hệ thống Watermarking trên ảnh
Signum
Technologies
Một công ty Anh phát triển hệ
th
ống Watermarking
'SureSign' dùng cho bảo vệ bản quyền và hệ thống 'VeriData'
dùng để xác thự tính toàn vẹn của các ảnh số.
Digimarc
Các công nghệ có bằng sáng chế của
Digimarc
cho phép dữ
liệu kĩ thuật số được nhúng trong
các
tài liệu có giá trị
như giấy tờ tài chính, thị thực, g
i
úp ngăn chặn giả mạo,
trộm và sử dụng không đượ
c
phép
1.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán Watermark có thể cho phép một số lượng bit cần
ẩn được định nghĩa trước. Không tồn tại các quy tắc chung, tuy nhiên đối với ảnh thì tối thiểu
300 - 400 bit. Trong bất kỳ trường hợp nào thì nhà thiết kế hệ thống phải nhớ rằng tốt nhất là
không nên giới hạn số lượng bit được nhúng vào dữ liệu.
1.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng như các biến dạng tín hiệu, khả năng không
dò được Watermark đã nhúng hoặc dò sai Watermark phải rất nhỏ. Thông thường các thuật
toán dựa trên thống kê dễ dàng thỏa được các yêu này. Tuy nhiên một khả năng như vậy phải
được đưa lên hàng đầu nếu ứng dụng Watermarking liên quan đến luật pháp vì có như vây
mới tạo sự tin cậy chắc chắn trong các phán quyết cuối cùng.
1.2.6 Tính bền vững
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới dạng kỹ thuật số thông
thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thông tin, hay trong
trường hợp ảnh là các phép lọc, định lại kích thước, cải tiến độ tương phản, phép quay, v.v.
7
Để Watermarking hữu ích, Watermark phải dò được ngay khi cả các biến dạng xảy ra. Quan
điểm chung để đạt được tính mạnh mẽ chống được các biến dạng tính hiệu là đặt Watermark
vào các phần quan trọng của tín hiệu. Điều này phụ thuộc vào cách xử lý của các thuật toán
nén có mất thông tin (bỏ qua các phần dữ liệu không quan trọng mà không làm ảnh hưởng
đến chất lượng của dữ liệu được nén. Điều này dẫn đến một Watermark được ẩn trong các dữ
liệu không quan trọng khó tồn tại khi bị nén. Trong trường hợp Watermarking trên ảnh, sức
chịu đựng với các xử lý hình học (dịch chuyển, định lại kích thước, quay, xén ) thì vẫn là một
vấn đề mở, những thao tác như vậy rất thông thường và một giải pháp đề ra cần giải quyết
được trước khi áp dụng Watermark cho bảo vệ tác quyền ảnh.
1.2.7 Nhúng nhiều Watermark
Cần phải cho phép nhúng một tập hợp các Watermark khác nhau trong cùng ảnh bằng
cách sao cho mỗi Watermark có thể dò được bởi người dùng được cấp quyền. Đặc trưng này
thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền được truyền từ
người sở hữu tác phẩm đến các tác phẩm khác. Hơn nữa chúng ta có thể ngăn người khác thực
Watermarking ảnh được đề xuất gần đây, các sản phẩm thương mại thường áp dụng các hệ
thống public trong khi các nghiên cứu lại tập trung vào tiếp cận private.
1.2.9 Watermarking đọc được và dò được
Một Watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi là một
Watermark dò được. Ngược lại các kỹ thuật cho phép Watermark đọc được ngay khi nội dung
của nó bỏ qua thì gọi là Watermark đọc được. Nói cách khác, theo hướng tiếp cận dò được,
người ta có thể chỉ cần biết một Watermark có tồn tại trong dữ liệu hay không. Nếu một người
không biết Watermark là gì thì không thể phân tích tài liệu đa phương tiện để tìm ra
Watermark. Điều này không giống với các kỹ thuật đọc được, trong đó cơ chế nhúng và trích
Watermark được thực hiện sao cho bất kỳ ai cũng có thể đọc được Watermark. Dĩ nhiên tính
chất đọc được/ dò được của Watermark ảnh hưởng nhiều đến cách mà nó được sử dụng trong
các ứng dụng thực tế. Ví dụ giả sử có một tình huống trong đó người ta muốn biết ai là người
sở hữu của một ảnh mà anh ta đã tìm đã tìm thấy đâu đó trên Internet. Ngoài ra giả sử rằng
Watermark chỉ ra người sở hữu đã được nhúng trong ảnh sử dụng kỹ thuật Watermarking dò
được. Không có cách nào để đọc được Watermark nếu không thực hiện các giả định về người
sở hữu có thể, bởi vì nhờ tính chất dò được của Watermark chỉ có thể xác định ảnh có thuộc
một tác giả cụ thể nào đó (Watermark của anh ta được biết ) không.
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark
Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏa mãn, mối
quan tâm lớn lại tập trung vào tính khả đảo của Watermark. Thuật ngữ khả đảo được dùng với
những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa một Watermark là khả đảo nếu các
người dùng được cấp quyền có thể xoá nó khỏi tài liệu. Trong nhiều ứng dụng tính khả đảo
này có thể là một đặc trưng mong đợi, bởi vì nó có thể cho phép thay đổi tình trạng của một
tài liệu cho trước theo lịch sử của nó mà không cần phải ẩn quá nhiều bit thông tin trong nó.
Tính khả đảo của Watermark còn được định nghĩa theo cách khác: đó là khả năng làm mất
hiệu lực thừa nhận quyền sở hữu được hỗ trợ bởi Watermarking bằng cách sử dụng kỹ thuật
công nghệ đảo để đảo lại quy trình Watermarking. Một mô hình Watermarking để được sử
dụng thành công trong ứng dụng bảo vệ quyền sở hữu, tính không khả đảo của Watermark
phải được thỏa mãn. Hơn nữa đây chỉ là một điều kiện cần thiết phải thỏa mãn bởi vì tổng
9
Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các phương tiện thông
tin đại chúng có những nhu cầu như:
Các nhà quảng cáo muốn chắc chắn rằng đoạn chương trình quảng cáo của họ được
phát đủ thời gian mà họ đã mua từ các nhà phát sóng.
Các diễn viên tham gia đoạn chương trình quảng cáo đó muốn bảo đảm họ được trả
tiền bản quyền ứng với thời lương phát sóng từ các công ty quảng cáo.
Những người sở hữu một đoạn nhạc hay phim không muốn tác phẩm của mình bị xâm
phạm tác quyền qua việc thu và phát sóng lại.
10
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi tự động thụ động và chủ
động. Hệ thống theo dõi thụ động mô phỏng như một quan sát viên, nó chứa một máy tính
chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận được với một cơ sở dữ liệu các
tác phẩm biết trước. Lợi điểm của nó là không cần bất kỳ thông tin liên kết vào quá trình phát
sóng, và như vậy không đòi hỏi bất kỳ sự hợp tác nào với các nhà quảng cáo hay các nhà phát
sóng. Như vậy có thể áp dụng nó trong các dịch vụ điều tra thị trường nhằm mục đích cạnh
tranh. Khó khăn của hệ thống này là:
+ Thứ nhất, việc so sánh tín hiệu nhận được với cơ sở dữ liệu không phải chuyện tầm
thường. Về nguyên tắc, cần chia tín hiệu nhận được thành các đơn vị có thể phân tích được và
tìm chúng trong cơ sở dữ liệu. Tuy nhiên mỗi frame của video chứa hàng ngàn bit thông tin và
không thực tế chút nào cho quá trình tìm kiếm. Như vậy hệ thống trước hết phải xử lý tín hiệu
thành những chữ ký nhỏ hơn sao cho vừa đủ để phân biệt với tài liệu khác và phải đủ nhỏ để
lưu được trong cơ sở dữ liệu.
+ Thứ hai, sự giảm tín hiệu trong quá trình phát sóng là điều không tránh khỏi, nó thay
đổi theo thời gian, tức là sự thu tín hiệu của cùng một nội dung ở các thởi điểm khác nhau có
thể dẫn đến những tín hiệu khác nhau. Vì thế, hệ thống không thể tìm nó chính xác trong cơ
sở dữ liệu mà chỉ có thể tìm dưới dạng người láng giềng gần nhất, thực tế phức tạp hơn nhiều.
+ Thứ ba, ngay cả khi vấn đề tìm kiếm được giải quyết thì việc lưu trữ và quản lý cơ
sở dữ liệu cũng là vấn đề lớn. Hơn nữa hệ thống phải theo dõi nhiều vị trí địa lý khác nhau
đồng thời, phải truy xuất và giao tiếp cơ sở dữ liệu trung tâm hoặc là lưu cơ sở dữ liệu cục bộ.
Hệ thống theo dõi chủ động đơn giản hơn về mặt kỹ thuật hơn vì thông tin nhận dạng
nó, đó là hãng Playboy. Ban đầu nó là một ảnh phóng to lồng giữa các trang của tạp chí
Playboy (Tháng 11- 1972 ). Khi ảnh được Scan và dùng cho mục đích kiểm thử, hầu hết ảnh
đã bị xén chỉ còn khuôn mặt và vai của Lena. Không may là dòng chữ ghi Playboy là người
sở hữu cũng bị xén mất. Từ đó ảnh được phân phối toàn cầu và hầu hết các nhà nghiên cứu
dùng nó trong các bào báo đã không biết rằng chúng là tác quyền của Playboy.
Thứ hai là vấn đề thẩm mỹ, dù chỉ đặt ở một phần của ảnh nhưng một dòng chữ thông
tin tác quyền có thể làm giảm bớt vẻ đẹp của nó. Với các tài liệu âm thanh hay phim, vì thông
báo tác quyền nằm trên băng đĩa vật lý và bao bì nên sẽ không có thông báo nào được sao
chép cùng với nội dung của nó.
Do các Watermark có thể vừa không thể nhận thấy vừa không thể tách rời tác phẩm
chứa nó nên chúng là giải pháp tốt hơn dòng chữ đối với việc nhận ra người sở hữu nếu
người dùng tác phẩm được cung cấp bộ dò Watermark. Digimarc cho ảnh là ứng dụng
mà ta đang đề cập. Nó được tích hợp vào Photoshop. Khi bộ dò của Digimarc nhận ra một
Watermark, nó liên lạc với cơ sở dữ liệu trung tâm trên Internet và dùng thông điệp
Watermark như một khóa để tìm thông tin liên lạc cho người sở hữu ảnh. Tính hợp pháp của
một ứng dụng như vậy chưa được thừa nhận bởi cơ quan pháp luật nhưng nó giúp những
người lương thiện dễ dàng tìm ra người họ muốn liên lạc để dùng ảnh. Như vậy, nhúng thông
tin của người giữ tác quyền của một tác phẩm như là một Watermark.
1.3.3 Bằng chứng về quyền sở hữu
Watermark không chỉ được dùng để chỉ ra thông tin tác quyền mà còn được dùng để
chứng minh tác quyền. Thông tin tác quyền có thể dễ bị giả. Chẳng hạn, giả sử A tạo một ảnh
và post lên mạng với thông tin tác quyền “© 2003 A”. Một tên trộm (B) lấy ảnh đó, dùng
chương trình xử lý ảnh để thay thông tin tác quyền đó bằng “© 2003 B” và sau đó tự cho là
12
anh ta là người sở hữu. Vậy giải quyết tranh luận ra sao. Nếu A đã đăng ký bản quyền tác
phẩm của mình với một cơ quan pháp luật và gửi cho họ ảnh gốc khi vừa mới tạo ra nó thì
không có vấn đề gì. Tuy nhiên nếu A không làm việc đó vì chi phí tốn kém thì A phải đưa ra
bằng chứng chứng tỏ mình đã tạo ra ảnh. Chẳng hạn, là một tấm phim nếu ảnh được chụp, là
một bản phát thảo nếu đó là một bức họa. Vấn đề là B cũng có thể ngụy tạo bằng chứng. Tệ
hơn nữa là nếu ảnh được chụp bằng kỹ thuật số thì chẳng có phim âm bản cũng như bản phát
per-view. Họ cài đăt nhiều kỹ thuật để ngăn giả mạo đĩa của họ, một trong số đó là
13
Watermark được thiết kế cho lưu vết giao tác. Mỗi DVD player phải đặt một Watermark duy
nhất vào mỗi video mà nó chiếu. Nếu ai đó thu lại đoạn video và bán các bản sao, DiVX có
thể lấy được bản copy đó và tìm ra kẻ phản bội bằng cách giải mã Watermark.
Một ví dụ khác là trong phân phối các nhật báo phim. Suốt quá trình thực hiện một
phim, kết quả các bức hình mỗi ngày được phân phối cho nhiều người có tham gia vào phim.
Nhưng những nhật báo này được yêu cầu giấu bí mật, không muốn bị lộ ra ngoài. Gặp trường
hợp này, trường quay nhanh chónh xác định được người đã làm rò rỉ thông tinh. Trường quay
có thể dùng đoạn văn hữu hình ở góc màn hình để xác định mỗi bản sao của ảnh. Tuy nhiên,
các Watermark được chuộng hơn vì đoạn văn bản dễ bị xóa đi.
1.3.5 Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trước nguy cơ bị làm giả nhiều hơn, dễ dàng
hơn và tinh vi hơn. Nếu ảnh là một bằng chứng quan trọng trong điều tra của cảnh sát, sự giả
mạo có thể gây ra nhiều vấn đề nghiêm trọng.
Bài toán xác nhận thông điệp đã được nghiên cứu rộng rãi trong lĩnh vực mã hóa
(crytography). Một tiếp cận mã hóa thông thường cho bài toán này là tạo ra một chữ kí điện
tử. Thuật toán được dùng là mã hóa khoá bất đối xứng. Chỉ có tác giả thông điệp mới biết
khoá cần để tạo ra các chữ ký. Do vậy, kẻ trộm cố thay đổi thông điệp thì sẽ không tạo ra
được một chữ ký mới. Nếu khi tiến hành so sánh, thông điệp được sửa đổi khác với chữ ký
gốc, ta có thể khẳng định thông điệp đã bị sửa. Chữ ký điện tử đã được áp dụng cho các
camera kỹ thuật số bởi Fredman, người gợi ý tạo ra một máy ảnh có chữ ký bên trong. Khóa
để tạo chữ kí chỉ có trong máy ảnh mà thôi.
Chữ ký dạng như vậy chung qui là một dạng dữ liệu meta được đi kèm với tài liệu mà
chúng xác nhận. Điều này cho thấy rất dễ làm mất các chữ ký. Chẳng hạn một hệ thống xác
nhận ảnh lưu dữ liệu meta vào phần vào phần đầu (header) của ảnh JPEG. Nếu ảnh được
chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài liệu không còn được chứng thực nữa.
Một giải pháp hay là những chữ ký trực tiếp vào tài liệu dùng kỹ thuật Watermarking.
Epson đề ra một hệ thống như vậy trên nhiều máy ảnh kỹ thuật số của hãng. Ta gọi chữ ký
này là chữ kí xác nhận (authentication mark). Chữ kí xác nhận được thiết kế sao cho trở nên
một ứng dụng kiểm soát sao chép ngăn không cho tạo các bản sao bất hợp pháp từ nội dung
đã có bản quyền.
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này. Tài liệu được mã hóa với
một khóa duy nhất, nếu không có khóa thì không dùng được. Tuy nhiên khóa này được cung
cấp theo kiểu khó mà sao chép hay phân phối lại (nhằm hạn chế thếp nhất khả năng khách
hàng cho khóa của họ cho người khác xài miễn phí). Ví dụ, nhiều sóng TV được mã hóa,
khóa giải mã được tích hợp vào một thẻ thông minh (smart card) cho các khách hàng nào trả
tiền. Thẻ thông tin được giấu vào hộp antene của TV. Nếu ai đó cố tình xem hay thu sóng mà
không có thẻ thông minh card chắc chắn chỉ thấy hình nhiễu. Điều đáng quan tâm là mã hóa
không thực sự giải quyết tốt ứng dụng này, vì chúng dễ bị phá bằng ba cách sau: Thứ nhất, cố
giải mã tín hiệu với hàng triệu trường hợp khóa có thể. Tuy nhiên nếu khóa ≥ 50 bit thì điều
này không thực hiện được. Thứ hai, dùng công nghệ đảo phần mềm hay phần cứng chứa
khóa. (Giống như crack phần mềm). Ví dụ như chương trình DeCSS của Jon Johanasen và
hai cộng sự người Đức. CSS (Content Scrambling System ) là hệ thống mã hoá dùng để
chống ghi DVD bất hợp pháp. Jon đã dùng công nghệ đảo áp dụng cho một đầu đọc DVD và
tìm khóa giải mã của nó. Sau đó bất kỳ video nào đã được mã hóa cũng có thể được giải mã.
Cách thứ ba là trả tiền để có một khóa rồi sao chép nội dung đã được giải mã. Một kẻ trộm
muốn thu và phát lại sóng vệ tinh chỉ cần đăng ký là khách hàng, mua một thẻ thông minh,
15
nối đầu đọc với đầu thu, cứ thể thu lại nội dung đã được giải mã. Ví dụ này chỉ ra yếu kém
chính của bảo vệ nội dung sử dụng mã hóa: Một nội dung muốn dùng được cần phải giải mã,
khi đã được giải mã rồi, tất cả các bảo vệ coi như không còn.
Điều chúng ta cần là làm sao cho dữ liệu media xem được nhưng vẫn ngăn không cho
thu lại. Một kỹ thuật làm được điều này, trong trường hợp video NTSC đó là quy trình chống
sao chép videocassette của Marovision. Quy trình này sửa tín hiệu video sao cho làm rối loạn
điều khiển trên VCRs. Tín hiệu thu được có thể xem tốt trên TV nhưng với VCR nó sẽ tạo ra
những thứ kông thể xem được. Tuy nhiên, kỹ thuật này chỉ áp dụng cho tím hiệu TV tuần tự ,
không được cho audio và các kiểu tín hiệu số khác. Do vậy mặc dù hệ thống của Macrovision
thích hợp để chống thu video bất hợp pháp bằng VCRs, nó lại không dùng được cho đầu
DVDs, VCRs số, hay các kỹ thuật thu video số khác.
nhờ lợi thế thông tin nhúng nằm kèm theo trong tài liệu chủ. Đó là các ứng dụng chung của
Watermarking trên các tài liệu đa phương tiện, riêng đối với ảnh số, bảo vệ bản quyền và xác
nhận nội dung là hai ứng dụng khả thi nhất, quan trọng nhất mà ảnh số có thể áp dụng được
và sẽ được nghiên cứu và phân tích sâu trong các chương sau.
17
CHƯƠNG 2. CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN
Các mô hình Watermarking hiện nay chia làm hai nhóm: thứ nhất là các mô hình dựa
trên quan điểm xem Watermarking như một phương thức truyền thông, và các mô hình dựa
trên quan điểm hình học.
2.1 Mô hình trên quan điểm Watermarking như một dạng truyền thông
Có 3 loại và chúng khác nhau ở cách tích hợp của tài liệu chủ vào trong hệ thống.
2.1.1 Mô hình cơ bản
Trong mô hình này, tài liệu chủ được xem như nhiễu được thêm vào trong suốt quá
trình truyền tín hiệu Watermark.
Hình 2: Bộ dò không cần ảnh gốc
Hình 3: Bộ dò cần ảnh gốc
Không quan tâm bộ dò ở đây là blind hay non-blind, qui trình nhúng bao gồm hai
bước:
Trước hết, thông điệp được ánh xạ thành một mẫu thêm (added pattern) wa có cùng
kiểu và kích thước với ảnh chủ c0. Ví dụ, trong Watermarking ảnh, bộ nhúng tạo ra một mẫu
các pixel hai chiều cùng kích thước với ảnh chủ gốc. Sự ánh xạ này được thực hiện với một
18
khóa Watermark. Các mẫu thêm thường được tính qua nhiều bước. Với các mẫu định nghĩa
sẵn và có thể phụ thuộc vào khóa, gọi là mẫu tham khảo (reference pattern) wr0, wr1, wr2,
chúng ta liên kết chúng lại để tạo ra một mẫu mã hóa, ta gọi là mẫu thông điệp (message
pattern), wm. Mẫu thông điệp này sau đó được chỉnh sửa hay thay đổi tỉ lệ để thu được mẫu
thêm.Sau đó, wa được thêm vào tài liệu chủ, c0, để tạo tài liệu được Watermark
(Watermarked Work), cw.
Sau khi mẫu thêm được nhúng, giả sử tài liệu được Watermark cw bị thay đổi vì một
xử lý nào đó, ta mô hình hóa hiệu ứng xử lý này bằng một nhiễu cộng. Các kiểu xử lý có thể
phép chiếu hoặc phép biến hình.
Hình 5: Bộ dò trong mô hình Watermarking theo quan niệm hình học trên không gian nhúng
Như hình trên, bộ dò như vậy chứa một qui trình gồm 2 bước:
+ Bước 1: Trích Watermark
Áp dụng một hay nhiều tiền xử lý cho tài liệu gốc chẳng hạn biến đổi tần số
(frequency transform), lọc (filtering) , trung bình khối (block averaging) , căn mép tạm hay
hình học (geomatric or temporal registration) và trích đặc trưng (feature extraction). Kết quả
thu được một vec tơ (một điểm trong không gian nhúng) có chiều nhỏ hơn chiều của vec tơ
ban đầu. Chúng ta gọi vec tơ này là vết trích. (extracted mark)
+ Bước 2 : Xác định xem vết trích có chứa Watermark không và nếu có thì giải mã
thông điệp được nhúng. Điều này đòi hỏi phải đi so sánh vết trích với một hay nhiều vết tham
20
khảo được định nghĩa trước (reference mark) . Bước 2 có thể là một bộ dò Watermark đơn
giản thực hiện trên các vec tơ trong không gian nhúng. Đối với các bộ nhúng Watermark
thường thì chúng không được thiết kế để dùng trong không gian nhúng nhưng trên thực tế vẫn
có thể thực hiện được.
Hình 6: Bộ nhúng trong mô hình Watermarking theo quan niệm hình học trên không gian
nhúng
Một bộ dò nhúng như vậy chứa một quy trình 3 bước như hình:
+ Bước 1: Tương tự bước trích trong bộ dò Watermark ở trên.
+ Bước 2: Chọn 1 vec tơ mới trong không gian nhúng gần với vết trích và hy vọng
rằng vec tơ này được dò có chứa Watermark. Vec tơ mới này ta gọi là vết thêm (added mark).
Bước 2 này có thể xem như bộ nhúng Watermark đơn giản thực hiện trong không gian nhúng.
+ Bước 3: Đảo ngược quy trình trích, chiếu vec tơ mới trở lại không gian đa phương
tiện để thu được tài liệu được Watermark. Nếu không gian nhúng có cùng chiều với không
gian đa phương tiện, phép chiếu có thể được thực hiện theo cách ánh xạ 1:1. Tuy nhiên, nếu
không gian nhúng có chiều nhỏ hơn không gian đa phương tiện, mỗi điểm trong không gian
nhúng phải tương ứng với không gian đa phương tiện. Do vậy, việc tìm một tài liệu sẽ nhận
vec tơ mới như một vết trích cho ta nhiều tài liệu khác nhau thỏa như vậy. Nói một cách lý
tưởng là, ta tìm một tài liệu mà được cảm nhận là gần với tài liệu gốc nhất. Trong thực tế, ta
o Không có mô hình
o Mô hình ẩn qua các thuộc tính miền biến đổi
o Mô hình HVS tường minh
• Theo mục đích của ứng dụng Watermarking
o Bảo vệ bản quyền, theo dõi việc phát hành
o Xác minh dữ liệu ảnh, xác nhận và phát hiện giả mạo
o Ẩn dữ liệu và gắn nhãn ảnh
ƒ …
• Theo kiểu dữ liệu đa phương tiện chủ:
o Ảnh tĩnh
o Video
o Các định dạng đa phương tiện khác như: ảnh hoạt họa, ảnh bản đồ, …
Trong các cách phân loại đó, một trong những cách được quan tâm nhất là cách bổ
sung dữ liệu Watermark vào ảnh chủ. Có 2 loại nhúng chủ yếu hay được đề nghị:
1. Nhúng cộng tuyến tính
• Chuỗi Gauss
• Hợp nhất ảnh
22
2. Nhúng lượng tử phi tuyến
• Lượng tử vô hướng
• Lượng tử hữu hướng (vector)
Đặc điểm của nhúng cộng là việc sửa đổi tuyến tính ảnh chủ và xử lý tương quan
trong lúc dò, còn nhúng lượng tử thực hiện các sửa đổi phi tuyến và dò tìm thông điệp nhúng
bằng cách lượng tử hóa các mẫu thu được để ánh xạ chúng vào trong điểm tái tạo gần nhất.
23
CHƯƠNG 3. ĐỘ AN TOÀN, TẤN CÔNG WATERMARK
Trong khi có những nghiên cứu về làm sao có thể tạo ra các Watermark có độ an toàn
cao thì cũng có những nghiên cứu tập trung về cách tấn công các mô hình Watermarking. Tấn
công watemark lại là một phần không thể bỏ quên khi sáng tạo ra một mô hình Watermarking
mới vì nó góp phần phân tích các điểm sơ hở, chưa thỏa đáng của một thuật toán để đề xuất
khoảng tần số. Nếu có một tiến trình làm hỏng tín hiệu thì cũng chỉ ảnh hưởng chỉ trên một
tần số và như vậy các chíp vẫn sóng sót vẫn còn nhận được và dùng được.
Truyền thông tán phổ có hai tính chất quan trọng có thể áp dụng vào Watermarking đó
là năng lượng được chèn vào bất kì một tần số nào cũng khá nhỏ. Điều này giúp giữ được tính
trực quan của anh. Thứ hai, nhờ Watermark phân tán rải rác trên nhiều tần số nên nó có độ an
toàn cao với các biến dạng tín hiệu thông thường.
3.1.3 Nhúng trong các hệ số quan trọng cảm nhận được
Không phải tất cả các hệ số trong cách trình bày của một ảnh đều có ích. Chẳng hạn,
đối với phép tịnh tiến, trong khi thành phần biên độ của phổ Fourier là không bị ảnh hưởng thì
miền tần số cao của biến đổi Fourier này lại bị thay đổi khá nhiều. Trong các pháp xử lý ảnh
khác, điều này càng rõ ràng hơn: nén có mất lượng hóa các tần số cao thành không, phép
halftoning cộng các nhiễu cao tần, quét ảnh áp dụng bộ lọc băng thông thấp trước khi lấy
mẫu. Nếu sử dụng các hệ số không đáng tin cậy đó trong quá trình dò, hệ thống sẽ không bảo
đảm được tính tin cậy. Vậy làm sao quyết định hệ số nào là tin cậy hay không. Ta đề xuất các
hệ số tin cậy là các hệ số quan trọng theo cảm quan, đó là các hệ số không bao giờ thay đổi
trừ khi ảnh bị biến dạng nhận thấy được. Nói cách khác, Watermark không nhất thiết phải
sống sót qua các xử lý làm hỏng chất lượng trực quan vì thông tin tác quyền cho một ảnh chất
lượng xấu, một đoạn âm thanh tồi thì không cần thiết.
Một hướng tiếp cận này là phân tán Watermark trong nhiều hệ số quan trọng cảm quan
trong miền tần số. Do mã hóa tán phổ cho phép sử dụng năng lượng nhỏ trong mỗi tần số nên
thay đổi trong mỗi hệ số thì nhỏ vừa đủ để không thể mất chất lượng cảm quan.
3.1.4 Nhúng trong các hệ số được cho là mạnh mẽ
Trong một số ứng dụng, chúng ta không nhất thiết đòi hỏi ảnh phải sóng sót qua tất cả
các xử lý (cách tiếp cận 3) mà chỉ cần mạnh mẽ, an toàn cao với chỉ một số xử lý cụ thể. Cách
thông thường là thực hiện các thử nghiệm biến dạng vào ảnh và đo lường tính mạnh mẽ của
nó trong một miền nào đó, từ đó chọn ra các hệ số được xem là manh mẽ.
3.1.5 Đảo nhiễu trong bộ dò
Trong hướng tiếp cận này, trước khi bộ dò trích Watermark từ ảnh mang, nó tìm và
phát hiện các xử lý đã thực hiện trên ảnh, đảo lại các xử lý đó nếu có thể. Sau cùng mới thực
hiện việc trích. Bước khó thực hiện nhất là xác định nhiễu nào đã xảy ra để thực hiện phép