Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
§¹i häc Th¸i Nguyªn
khoa c«ng nghÖ th«ng tin NGÔ THÁI HÀ
NGHIÊN CỨU KỸ THUẬT
BẢO VỆ BẢN QUYỀN CÁC SẢN PHẨM
ĐỒ HỌA VECTƠ
LuËn v¨n th¹c sÜ : KHOA HỌC MÁY TÍNH
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 LuËn v¨n th¹c sÜ : KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS ĐẶNG VĂN ĐỨC
Th¸i Nguyªn - 2009
iv
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên DANH MỤC CÁC CHỮ VIẾT TẮT Chữ
Mục lục ........................................................................................................ i
Danh mục các ký hiệu, chữ viết tắt ............................................................... iv
Danh mục các bảng ...................................................................................... v
Danh mục các hình (hình vẽ, hình chụp, đồ thị) ........................................... iv
MỞ ĐẦU: .................................................................................................... 1
1. ĐẶT VẤN ĐỀ ............................................................................... 1
2. MỤC ĐÍCH CỦA LUẬN VĂN .............................................................. 2
3. BỐ CỤC LUẬN VĂN............................................................................. 3
NỘI DUNG ..................................................................................................
CHƢƠNG 1: TỔNG QUAN VỀ GIẤU TIN ................................................ 4
1.1. Các khái niệm cơ bản về giấu tin ........................................................... 4
1.1.1. Định nghĩa: ....................................................................................... 4
1.1.2. Phân loại các kỹ thuật giấu tin ............................................................ 5
1.1.3. Vài nét về lịch sử giấu tin ................................................................... 9
1.1.4. Các yêu cầu đối với giấu tin cho ảnh .................................................. 10
1.1.5. Mô hình kỹ thuật giấu tin ................................................................... 12
1.1.6. Các ứng dụng của kỹ thuật giấu tin ..................................................... 13
1.1.7. Các kiểu đánh dấu ẩn .......................................................................... 15
1.2. Giấu tin trong ảnh những đặc trƣng và tính chất ................................... 15
1.2.1. Giấu tin trong ảnh ............................................................................... 15
1.2.2. Những đặc trƣng và tính chất ............................................................. 16
1.2.3. Các phƣơng pháp giấu tin ................................................................... 19
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ii
1.3. Kết luận chƣơng .................................................................................... 21
CHƢƠNG 2: GIẤU TIN TRONG BẢN ĐỒ VÉC TƠ ................................. 23
2.1. Bản đồ ................................................................................................... 23
2.2. Thủy vân bản đồ véc tơ ......................................................................... 25
a. Biến đổi Fourier ....................................................................................... 45
b. Biến đổi Fourier liên tục ........................................................................... 47
c. Biến đổi Fourier rời ................................................................................. 49
3.2.1. Những biến đổi Fourier trong véc tơ................................................... 51
3.3. Kết luận chƣơng .................................................................................... 51
CHƢƠNG 4: CHƢƠNG TRÌNH THỬ NGHIỆM ........................................ 52
4.1. Mô tả bài toán thử nghiệm ..................................................................... 52
4.2. Định dạng cấu trúc tệp Shapefile .......................................................... 53
4.2.1. Tổ chức dữ liệu khuôn mẫu của Shapefile ......................................... 54
4.2.2. Quy ƣớc về tên tệp .............................................................................. 54
4.2.3. Kiểu dữ liệu ...................................................................................... 55
4.2.4. Cấu trúc của Main file ....................................................................... 55
4.2.5. Cấu trúc của tệp chỉ số (Index file) .................................................... 64
4.2.6. Cấu trúc của tệp chứa cơ sở dữ liệu .................................................. 65
4.3. Quy trình giấu thông tin......................................................................... 65
a. Phân tích thuật toán .................................................................................. 65
b. Giấu thông tin ........................................................................................... 66
4.4. Quy trình tách thông tin ......................................................................... 69
4.5. Kết luận chƣơng .................................................................................... 70
KẾT LUẬN .................................................................................................. 71
vi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên DANH MỤC CÁC HÌNH VẼ Tên hình Ý nghĩa
Hình 1.1 Phân loại các kỹ thuật giấu tin (Fabien A.P. Petitcolaset al., 1999)
MỞ ĐẦU:
1. ĐẶT VẤN ĐỀ
Ngày nay, với sự ra đời và phát triển của mạng Internet. Mọi người đều có
thể kết nối vào Internet, tìm kiếm thông tin một cách dễ dàng thông qua nhà
cung cấp dịch vụ mạng.
Sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặc
biệt là trong lĩnh vực đa phương tiện (multimedia) làm cho sự sản xuất, quản lý
và phân phối các sản phẩm này: hình ảnh, âm thanh… rất dễ dàng. Cùng với sự
phổ biến rộng rãi các mạng internet tốc độ cao làm cho quá trình phân phối
chúng trở nên rất nhanh chóng, dễ dàng, đem lại những thuận lợi to lớn thông
qua hệ thống thương mại điện tử.
Với môi trường mở và tiện nghi như thế, các hệ thống mạng hiện đại trở
thành phương tiện phân phối tài liệu một cách nhanh chóng và kinh tế. Tuy
nhiên, việc phân phối một cách phổ biến các tài nguyên trên mạng hiện nay luôn
gặp phải vấn nạn sao chép và sử dụng không hợp pháp như: Xâm phạm bản
quyền, truy cập trái phép, xuyên tạc, giả mạo thông tin…
Đi đôi với sự phát triển của công nghệ máy tính thì tình trạng sử dụng bất
hợp pháp các sản phẩm số (tệp tin tài liệu, chương trình, âm thanh và hình ảnh...)
ngày càng tăng, do các tệp tin số có thể sao chép dễ dàng giữa các máy tính. Dẫn
đến tình trạng vi phạm bản quyền số đang xảy ra hàng ngày, hàng giờ trên khắp
thế giới. Nhằm bảo vệ các sản phẩm số không bị sử dụng trái phép, song song
với việc kêu gọi ý thức tự giác thực thi luật bản quyền, các công ty công nghệ
lớn trên thế giới đã và đang thực hiện các giải pháp kỹ thuật kiểm soát bản quyền
số. Một trong những vấn đề được đặt ra là làm sao bảo vệ quyền sở hữu đối với
các sản phẩm đa phương tiện này.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
Đứng trước tình hình đó vấn đề về bảo mật thông tin hiện nay luôn nhận
giải mã với các khóa phù hợp, ta có thể trích được thông tin cần dấu.
Nội dung của luận văn này tập trung nghiên cứu các phương pháp giấu tin
trong ảnh bitmap, ảnh vector, các phương pháp thủy vân số [14], [15], một số
phương pháp giấu tin dựa vào các phép biến đổi DCT, DFT, DWT.
3. BỐ CỤC LUẬN VĂN
Luận văn gồm trang, được trình bày trong 3 chương, có phần mở đầu,
phần kết luận, phần mục lục, phần tài liệu tham khảo. Các nội dung cơ bản của
luận văn được trình bày theo cấu trúc như sau:
Chƣơng 1: Tổng quan về giấu tin
Trình bày tổng quan về giấu tin, phân tích các yêu cầu đối với giấu tin cho
ảnh, trình bày một số loại hình giấu tin và các yêu cầu đối với giấu tin trong ảnh.
Bên cạnh đó trình bày một số mô hình giấu tin và các ứng dụng của chúng,
những đặc trưng và tính chất của giấu tin trong ảnh. Ngoài ra, một nội dung rất
quan trọng trong chương này đó là các phương pháp giấu tin và các thuật toán
giấu tin.
Chƣơng 2 : Các kỹ thuật giấu tin trong ảnh
Tập trung phân tích, đánh giá các thuật toán giấu tin trong ảnh, kỹ thuật
biến đổi Fourier. Biến đổi Fourier trong ảnh vector, các thuật toán giấu và tách
thông tin trong ảnh vector.
Chƣơng 3: Xây dựng chƣơng trình
Trình bày cấu trúc bản đồ dạng shapefile và biến đổi DFT, xây dựng thuật toán
nhúng tách watermark. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
CHƢƠNG 1: TỔNG QUAN VỀ GIẤU TIN
1.1. Các khái niệm cơ bản về giấu tin
hay không. Khuynh hướng thứ hai là thuỷ vân số (watermarking). Khuynh
hướng thuỷ vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền sở hữu
hay phát hiện xuyên tạc thông tin. Thuỷ vân số có miền ứng dụng lớn hơn nên
được quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật dành
cho khuynh hướng này.
1.1.2. Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây
nên xu hướng phát triển chưa ổn định. Nhiều phương pháp mới, theo nhiều khía
cạnh khác nhau đang và chắc chắn sẽ được đề xuất, bởi vậy một định nghĩa
chính xác, một sự đánh giá phân loại rõ ràng chưa thể có được. Sơ đồ phân loại
trên được Fabien A. P. Petitcolas đề xuất năm 1999.
Có thể chia lĩnh vực giấu tin thành hai hướng lớn là thủy vân số và giấu tin
mật [18]. Giấu tin mật quan tâm đến các ứng dụng sao cho người khác khó phát
hiện nhất việc có tin được giấu và nếu có phát hiệ tin được giấu thì việc giải tin
cũng khó thực hiện nhất.
Phạm vi ứng dụng của thủy vân đa dạng hơn, tùy theo mục đích của hệ
thủy vân mà người ta lại chia thành các hướng nhỏ như thủy vân dễ vỡ và thủy
vân bền vững.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
7
khoá viết mật đó. Chú ý rằng khoá này không phải là khoá dùng để lập mật mã
mẩu tin, ví dụ nó có thể là khoá để sinh ra hàm băm phục vụ rải tin vào môi
trường phủ. Ngược lại nếu không dùng khoá viết mật thì người ta chỉ dấu tin đơn
thuần vào môi trường phủ thì khi đó người ta nói về Pure Steganography (dấu
tin đơn thuần).
Watermarking (thuỷ ấn) là kỹ thuật nhúng một biểu tượng vào trong ảnh
môi trường để xác định quyền sở hữu ảnh môi trường, chống sự giả mạo và
xuyên tạc thông tin. Kích thước của biểu tượng thường nhỏ (từ vài bit tới vài
nghìn bit). Kỹ thuật này cho phép đảm bảo nguyên vẹn biểu tượng khi ảnh môi
trường bị biến đổi bởi các phép thao tác như lọc (filtering), nén mất dữ liệu
(lossy compression), hay các biến đổi hình học, .... Tuy nhiên việc đảm bảo
nguyên vẹn biểu tượng không kể đến khi có sự tấn công dựa trên việc hiểu rõ
thuật toán và có bộ giải mã trong tay. Thông tin giấu là một định danh duy nhất,
ví dụ định danh người dùng thì khi đó người ta gọi là Fingerprinting (nhận dạng
vân tay, điểm chỉ).
Nếu như watermark (thủy vân, thủy ấn) quan tâm nhiều đến ứng dụng
giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu
(trước các biến đổi thông thường của tệp dữ liệu môi trường) thì steganography
lại quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật và dung lượng
càng lớn càng tốt. Đối với từng hướng lớn này, quá trình phân loại theo các tiêu
chí khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động
từ bên ngoài có thể chia watermark thành hai loại, một loại bền vững với các
tác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ
bị phá huỷ trước các tác động nói trên. Cũng có thể chia watermark theo đặc
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
tính, một loại cần được che giấu để chỉ có một số người tiếp xúc với nó có thể
các bước tách tin giống nhau với các ảnh khác nhau, ta sẽ tách được dấu bản
quyền đã được đăng ký trước đối với ảnh bị xuyên tạc.
Hầu hết giấu tin được gắn cho ảnh là giấu không nhìn thấy nhưng trên
thực tế tồn tại một loại giấu tin có thể nhìn thấy, chúng không trong suốt hoàn
toàn.Tuy nhiên nội dung của luận văn này tôi chỉ đề cập tới loại giấu tin không
nhìn thấy.
1.1.3. Vài nét về lịch sử giấu tin
Các kỹ thuật giấu tin đã được đề xuất và sử dụng từ xa xưa, và sau này đã
được phát triển ứng dụng cho nhiều lĩnh vực. Từ Steganography bắt nguồn từ
Hi-Lạp với ý nghĩa là tài liệu được phủ (covered writing). Các câu chuyện kể về
kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ những ghi chép sớm
nhất về kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa nguyên thủy của
nó) thuộc về sử gia Hy-Lạp Herodotus. Khi bạo chúa Hy-Lạp Histiaeus bị vua
Darius bắt giữ ở Susa vào thế kỷ thứ năm trước Công nguyên, ông ta đã gửi một
thông báo bí mật cho con rể của mình là Aristagoras ở Miletus. Histiaeus đã cạo
trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ
ấy. Khi tóc của người nô lệ này mọc đủ dài người nô lệ được gửi tới Miletus.
Một câu chuyện khác về thời Hy-Lạp cổ đại cũng do Herodotus ghi lại.
Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong.
Demeratus, một người Hy-Lạp, cần thông báo cho Sparta rằng Xerxes định xâm
chiếm Hy-Lạp. Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viên
thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
thuốc bằng một lớp sáp mới. Những viên thuốc được để ngỏ và lọt qua mọi sự
kiểm tra một cách dễ dàng.
Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong một
thời gian dài. Người Romans cổ đã biết sử dụng những chất sẵn có như nước
bản quyền và ảnh gốc sẽ không thể phân biệt được bằng mắt thường. Như vậy
giá trị của bức ảnh sẽ không bị thay đổi và việc các tin như vậy sẽ là rào cản lớn
cho những kẻ phá hoại trong việc cố gắng xoá hoặc sửa đổi các thông tin về bản
quyền ảnh. Trên thực tế khi chèn tin vào ảnh thì ảnh kết quả và ảnh gốc sẽ có
những sai khác, để không thể nhận ra được những thay đổi về nội dung dữ liệu
này, người ta thường khai thác các đặc điểm về khả năng cảm thụ của mắt người.
Tính bền của giấu tin liên quan đến việc tách tin từ ảnh có bản quyền một
ảnh sau khi được đánh dấu có thể được đem ra xử lý để phục vụ cho các mục
đích khác nhau như nén ảnh, biến đổi hình học, lọc ảnh cải thiện ảnh , các biến
đổi cố tình để xoá dấu tin ra khỏi ảnh,…v.v. Vấn đề được đặt ra liệu sau khi ảnh
bị xử lý ta còn có thể tách được lượng tin ra khỏi ảnh không và tách được thì
chất lượng của tin có đảm bảo tin cậy không như ta đã biết khi chèn một dấu ẩn
vào ảnh thì trước hết phải đảm bảo tính ẩn của nó, nói cách khác thông tin về
dấu ẩn có năng lượng rất nhỏ so với thông tin ảnh. Mặt khác để tăng tính bền cho
dấu ẩn ta phải tăng năng lượng của thông tin dấu ẩn được chèn vào ảnh điều này
đối nghịch với yêu cầu của tính ẩn .Do vậy việc đảm bảo sự tồn tại của dấu ẩn
trong ảnh cũng giống như việc đảm bảo truyền tín hiệu có năng lượng nhỏ trong
môi trường có nhiễu lớn. Đây là cơ sở để áp dụng các phương pháp xử lí tín hiệu
số trong chèn dấu ẩn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
Trong trường hợp một ảnh được chèn nhiều ký hiệu bản quyền thì các ký
hiệu này phải đảm bảo có thể phân biệt được. Tuy nhiên việc tăng số lượng các
dấu ẩn cũng đồng nghĩa với việc tăng lượng của các thông tin được chèn vào ảnh
do đó tính ẩn của ảnh cũng bị ảnh hưởng theo chiều hướng giảm. Tóm lại các
yêu cầu đặt ra đối với đánh dấu ẩn cho ảnh có chiều hướng xung đột nhau, nếu
thoả mãn tốt yêu cầu này thì không đáp ứng được yêu cầu kia và ngược lại. Qua
đó ta có kết luận rằng không thể có mô hình đánh dấu ẩn nào cho ảnh một cách
1.1.6. Các ứng dụng của kỹ thuật giấu tin
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ thuật thủy
vân số. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là thủy vân
sẽ được nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình chủ sở hữu
hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản
phẩm. Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm
thanh, video và cần được lưu thông trên mạng. Để bảo vệ các sản phẩm chống lại
các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “ dán tem bản
Ảnh gốc
Ảnh có bản quyền
u
Tách tin Tin
Khóa k
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
quyền ” vào sản phẩm này. Việc dán tem hay chính là việc nhúng thủy vân cần
phải đảm bảo không để lại một ảnh hưởng đáng kể nào đến việc cảm nhận sản
phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững
cùng với sản phẩm, muốn bỏ thủy vân này mà không được phép của người chủ
sở hữu thì chí có cách là phá hủy sản phẩm[18].
Xác thực thông tin hay phát hiện xuyên tạc thông tin: Một tập các thông
tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng để nhận biết xem
dữ liệu trên phương tiện gốc đó có bị thay đổi không. Các thủy vân nên được ẩn
để tránh sự tò mò của kẻ thù, hơn nữa việc làm giả các thủy vân hợp lệ hay
xuyên tạc thông tin nguồn cũng cần được xem xét. Trong các ứng dụng thực tế
người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các
thay đổi. Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và
thủy vân không cần bền vững[18].
Đánh dấu ẩn nhìn thấy
Đánh dấu ẩn bền vững –vô hình
Đánh dấu ẩn dễ vỡ -vô hình
1.2. Giấu tin trong ảnh những đặc trƣng và tính chất
1.2.1. Giấu tin trong ảnh
Giấu tin trong ảnh, hiện nay, là một bộ phận chiếm tỷ lệ lớn nhất trong các
chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong dữ liệu đa
phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn. Hơn nữa, giấu
thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong hầu hết các ứng
dụng bảo vệ an toàn thông tin như: nhận thức thông tin, xác định xuyên tạc thông
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
tin, bảo vệ bản quyền tác giả, điều khiển truy nhập, giấu thông tin mật … Vì thế
mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức,
trường đại học, và viện nghiên cứu trên thế giới.
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay
đổi và ít ai biết được bên trong bức ảnh đó mang những thông tin có ý nghĩa
khác. Và ngày nay, khi ảnh số đã được sử dụng phổ biến, thì giấu thông tin đã
đem lại rất nhiều những ứng dụng quan trọng trong trên nhiều lĩnh vực trong đời
sống xã hội. Ví dụ như đối với các nước phát triển, chữ ký tay đã được số hóa và
lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó
được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng. Thêm vào
đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật, chúng rất dễ bị
lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. Việc nhận thực cũng như
phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết. Một
đặc điểm của giấu thông tin trong ảnh đó là thông tin được giấu trong ảnh một
cách vô hình, nó như là một cách truyền thông tin mật cho nhau mà người khác
không thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không
cảm nhận về sự biến đổi về độ chói kém hơn sự biến đổi về màu hay cảm nhận
của mắt về màu xanh da trời kém nhất trong ba màu cơ bản.
*) Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích
thước ảnh
Các thuật toán thực hiện công việc giấu thông tin sẽ được thực hiện trên
dữ liệu của ảnh. Dữ liệu ảnh bao gồm phần header, bảng màu (có thể có) và dữ
liệu ảnh. Do vậy mà kích thước ảnh trước hay sau khi giấu thông tin là như nhau.