nghiên cứu một số khả năng phát hiện tin giấu trong môi trường ảnh - Pdf 10


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
MAI THÀNH HUYÊN
NGHIÊN CỨU MỘT SỐ KHẢ NĂNG PHÁT HIỆN
TIN GIẤU TRONG MÔI TRƯỜNG ẢNH
Ngành : Công nghệ thông tin
Chuyên ngành : Hệ thống thông tin
Mã số : 60 48 05
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. TRỊNH NHẬT TIẾN
HÀ NỘI - 2009
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các dữ liệu, kết quả
nêu trong luận văn là trung thực và chưa từng được công bố trong bất kỳ công trình
nào khác.
Hà nội, tháng 11 năm 2009
Tác giả luận văn
Mai Thành Huyên
LỜI CẢM ƠN
Tôi xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Công nghệ thông tin và
các cán bộ, nhân viên các phòng Đào tạo Sau đại học, trường Đại học Công nghệ, Đại

1.1.5 Các ứng dụng của kỹ thuật giấu tin 5
1.2 GIẤU THÔNG TIN TRONG DỮ LIỆU ĐA PHƯƠNG TIỆN 6
1.2.1 Giấu tin trong ảnh 6
1.2.2 Giấu tin trong audio 6
1.2.3 Giấu tin trong video 7
1.2.4 Giấu tin trong văn bản 7
1.3 NHỮNG ĐẶC TRƯNG VÀ TÍNH CHẤT CỦA GIẤU TIN TRONG ẢNH 8
1.4 CÁC HƯỚNG TIẾP CẬN CỦA KỸ THUẬT GIẤU TIN TRONG ẢNH 10
1.4.1 Tiếp cận trên miền không gian ảnh 10
1.4.2 Tiếp cận trên miền tần số ảnh 10
1.5 MỘT SỐ PHƯƠNG PHÁP GIẤU TIN MẬT TRONG ẢNH 12
1.5.1 Giấu tin mật trong khối bit sử dụng tính chẵn lẻ của tổng số bit 1 12
1.5.2 Kỹ thuật giấu tin Wu _ Lee 17
1.5.3 Kỹ thuật giấu tin Yuan_Pan_Tseng 23
1.6 KỸ THUẬT THỦY VÂN TRÊN ẢNH 32
1.6.1 Một số khái niệm cơ bản trong thủy vân số 32
1.6.2 Một số kỹ thuật thủy vân trên ảnh 36 Chương 2. MỘT SỐ KHẢ NĂNG PHÁT HIỆN ẢNH CÓ GIẤU TIN 55
2.1 PHƯƠNG PHÁP PHÁT HIỆN ẢNH GIẤU TIN 55
2.1.1 Bài toán phân tích tin giấu 56
2.1.2 Phân loại phương pháp phát hiện ảnh giấu tin 57
2.2 Cơ sở toán học 58
2.2.1 Các khái niệm 58
2.2.2 Các định lý 62
2.3 KỸ THUẬT PHÂN TÍCH CẶP GIÁ TRỊ ĐIỂM ẢNH 63
2.3.1 Khái niệm cặp giá trị 63
2.3.2 Thuật toán PoV3 64
2.4 KỸ THUẬT PHÂN TÍCH ĐỐI NGẪU 69

1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN
1.1.1 Khái niệm giấu tin
“Giấu thông tin” gọi tắt là “Giấu tin”, tiếng Hi Lạp là “Steagnography”, tiếng
Anh là “Cover Writing”. “Giấu thông tin” là một kỹ thuật nhúng (giấu) một lượng
thông tin số nào đó vào trong một đối tượng dữ liệu số khác [2].
Kỹ thuật giấu tin nhằm hai mục đích: một là bảo mật cho dữ liệu được đem giấu,
hai là bảo vệ cho chính đối tượng mang tin giấu. Hai mục đích khác nhau này dẫn đến
hai kỹ thuật chủ yếu của giấu tin. Đó là giấu tin mật và thủy vân số. Nói chung giấu tin
trong đa phương tiện là tận dụng “độ dư thừa” của phương tiện giấu để thực hiện việc
giấu tin, mà người ngoài cuộc “khó” cảm nhận được có thông tin giấu trong đó.
1.1.2 Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu tin số mới được hình thành trong thời gian gần đây, nên xu
hướng phát triển vẫn chưa ổn định. Có nhiều cách phân loại khác nhau dựa trên những
tiêu chí khác nhau. Theo Fabien A.P. Petitcolas đề xuất năm 1999, có thể chia lĩnh vực
giấu tin thành hai hướng lớn, đó là giấu tin mật và thủy vân số [6].
Giấu tin mật với mục đích bảo toàn và bảo mật thông tin, tập trung vào các kỹ
thuật giấu thông tin, sao cho người khác khó phát hiện việc có tin được giấu; hơn nữa
nếu phát hiện có tin giấu thì giải tin cũng khó thực hiện. Bên cạnh đó cũng đặt ra vấn
đề về lượng tin được giấu.
Thủy vân số lại được chia thành hai hướng nhỏ là thủy vân dễ vỡ và thủy vân bền
vững. Trong đó thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự
thay đổi vào trên môi trường chứa tin. Thủy vân bền vững quan tâm nhiều đến việc
nhúng tin đòi hỏi độ bền cao trước các biến đổi thông thường trên môi trường chứa tin.
2 Hình 1.1 Phân loại các kỹ thuật giấu tin
1.1.3 Sơ lược về lịch sử giấu tin
Từ “Steganography” bắt nguồn từ tiếng Hi Lạp. Từ “stegano” trong tiếng Hi Lạp
có nghĩa là “covered”, còn “graphien” có nghĩa là “to write”. Như vậy,

Thủy vân ẩn
Imperceptible
watermarking
Thủy vân hiện
Visble watermarking
3

Mực không màu là phương tiện hữu ích cho bảo mật thông tin trong một thời
gian dài. Người Romans cổ đã biết sử dụng những chất sẵn có như nước quả, nước tiểu
và sữa viết các thông báo bí mật giữa các hàng văn tự thông thường. Khi được hơ
nóng, những thứ mực này trở nên sẫm mầu và có thể đọc được. Mực không màu cũng
vẫn còn được sử dụng gần đây, chẳng hạn trong chiến tranh thế giới thứ II [5].
Ý tưởng về che giấu thông tin đã có hàng ngàn năm trước nhưng kỹ thuật này
được dùng chủ yếu trong quân đội và trong các cơ quan tình báo. Mãi cho tới vài thập
niên gần đây, giấu tin mới nhận được sự quan tâm của các nhà nghiên cứu và các viện
công nghệ thông tin với nhiều công trình nghiên cứu. Sự phát triển của thông tin số và
mạng truyền thông (đặc biệt là mạng Internet) cùng với các kỹ thuật sao chép hoàn
hảo, kỹ thuật chỉnh sửa, thay thế tinh vi đã và đang làm nảy sinh nhiều vấn đề nhức
nhối về nạn ăn cắp bản quyền, xuyên tạc trái phép, lan truyền thông tin bất hợp pháp.
1.1.4 Mô hình cơ bản của kỹ thuật giấu tin
Mô hình của kỹ thuật giấu tin được mô tả trong hình 1.2 và 1.3.

Hình 1.2 Lược đồ chung cho quá trình giấu tin
Bộ nhúng
thông tin
Khóa
Thông tin cần giấu
Phương tiện
chứa tin (audio,
ảnh, video,…)


Phương tiện
chứa đã
được giấu
tin

Kiểm
định
Phân
phối
Formatted: Left
Deleted
:
giải mã
Deleted
:
t
5

1.1.5 Các ứng dụng của kỹ thuật giấu tin
1.1.5.1 Ứng dụng của thủy vân số
* Bảo vệ bản quyền tác giả
Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số. Một thông tin nào đó
mang ý nghĩa quyền sở hữu gọi là thủy vân sẽ được nhúng vào trong sản phẩm. Thủy
vân đó chỉ một mình người chủ sở hữu hợp pháp sản phẩm đó có, và được dùng làm
minh chứng cho bản quyền sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy
vân phải tồn tại bền vững cùng sản phẩm, muốn bỏ thủy vân này mà không được phép
của người chủ sở hữu, thì chỉ có cách phá hủy sản phẩm [8].
* Xác thực thông tin hay phát hiện xuyên tạc thông tin
Một thông tin sẽ được giấu trong phương tiện chứa, sau đó sử dụng để nhận biết

nghiên cứu, các cá nhân quan tâm và đầu tư nghiên cứu [12].
Thông tin được giấu vào dữ liệu ảnh, nhưng chất lượng ảnh rất ít thay đổi và
người ta khó có thể nhận thấy bằng mắt thường. Sau vụ khủng bố ngày 11 tháng 9 năm
2001 gây chấn động không chỉ nước Mĩ mà cả thế giới, có một số nhận định cho rằng
chính trùm khủng bố quốc tế Osama Binladen đã dùng cách thức giấu thông tin trong
ảnh để liên lạc với đồng bọn và chúng đã qua mặt được cục tình báo trung ương Mĩ và
các cơ quan an ninh quốc tế. Sự việc này cho thấy việc nghiên cứu các vấn đề liên
quan đến giấu tin trong ảnh càng trở nên quan trọng.
1.2.2 Giấu tin trong audio
Giấu tin trong audio mang những đặc điểm riêng khác với giấu tin trong các đối
tượng đa phương tiện khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo
tính chất ẩn của thông tin được giấu, đồng thời không làm ảnh hưởng đến chất lượng
của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật giấu tin trong audio phụ thuộc vào
thính giác con người (HAS - Human Auditory System). HAS nghe được các tín hiệu ở
dải tần rộng và công suất cao nhưng ngược lại cũng kém trong việc phát hiện sự khác
biệt của các dải tần và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể
che giấu được các âm thanh nhỏ, thấp một cách dễ dàng.
Một vấn đề khó khăn nữa của giấu tin trong môi trường audio đó là kênh truyền
tin. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi
giấu. Các phương pháp giấu tin trong audio thường lợi dụng điểm yếu trong hệ thống
thính giác con người.

7

1.2.3 Giấu tin trong video
Giấu tin trong video cũng được quan tâm phát triển và có nhiều ứng dụng như
kiểm soát sao chép thông tin, xác thực thông tin và bảo vệ bản quyền tác giả. Một
phương pháp giấu tin được đưa ra bởi Cox là phương pháp phân bố đều. Ý tưởng cơ
bản của phương pháp là phân phối thông tin giấu dàn trải theo tần số dữ liệu gốc.
Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng

tạo ra sự khác biệt lớn giữa kỹ thuật giấu tin trong ảnh với kỹ thuật giấu tin trong audio
hay video.
Kỹ thuật giấu phụ thuộc loại ảnh
Kỹ thuật giấu tin phụ thuộc vào các loại ảnh khác nhau. Đối với ảnh đen trắng,
ảnh xám hay ảnh màu, với mỗi loại ta lại có các kỹ thuật riêng phụ thuộc đặc trưng của
ảnh.
Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người
Giấu tin trong ảnh ít nhiều cũng gây ra những thay đổi trên dữ liệu ảnh gốc. Dữ
liệu ảnh được quan sát bằng hệ thống thị giác của con người nên các kỹ thuật giấu tin
phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh phải rất nhỏ sao cho mắt
thường khó nhận ra được sự thay đổi đó, để đảm bảo độ an toàn cho thông tin giấu.
Rất nhiều kỹ thuật đã lợi dụng các tính chất của hệ thống thị giác để giấu tin chẳng hạn
như mắt người cảm nhận sự biến đổi về độ chói kém hơn sự biến đổi về màu hay cảm
nhận của mắt về màu da trời là kém nhất trong ba mầu cơ bản RGB.
Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích
thước ảnh
Các thuật toán giấu tin sẽ được thực hiện trên dữ liệu của ảnh. Dữ liệu ảnh bao
gồm cả phần đầu, bảng màu (có thể có hoặc không) và dữ liệu ảnh. Khi giấu thông tin,
các phương pháp giấu đều biến đổi các giá trị của các bit trong dữ liệu ảnh, chứ không
thêm vào hay bớt đi dữ liệu ảnh. Do vậy kích thước ảnh không thay đổi.
9

Đảm bảo chất lượng ảnh sau khi giấu
Đây là yêu cầu quan trọng đối với giấu tin trong ảnh. Sau khi giấu tin bên trong,
ảnh phải đảm bảo không bị biến đổi. Yêu cầu này dường như khá đơn giản đối với ảnh
màu và ảnh đa cấp xám nhưng đối với ảnh đen trắng thì phức tạp hơn nhiều. Bởi vì
ảnh đen trắng mỗi điểm ảnh chỉ là đen hoặc trắng, nếu ta biến đổi một bit đen thành
trắng hoặc ngược lại thì có thể rất dễ bị phát hiện. Do đó yêu cầu đối với giấu tin trong
ảnh màu hay ảnh đa cấp xám và trong ảnh đen trắng là khác nhau. Với ảnh màu thì
thuật toán chú trọng vào việc làm sao giấu được càng nhiều thông tin càng tốt, với ảnh

RGB, mỗi màu 1 byte. Người ta sử dụng tính chất là mắt người cảm nhận về màu B
kém hơn so với màu R và G. Vì thế người ta thường chọn bit cuối cùng trong 8 bit
biểu diễn màu B của mỗi điểm ảnh để giấu tin. Thay đổi bit cuối cùng trong 8 bit biểu
diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn vị. Như vậy,
bit LSB trong ví dụ này là bit thứ 24 của mỗi điểm ảnh.
Một số thuật toán muốn giấu nhiều thông tin hơn và chấp nhận chất lượng ảnh
thấp hơn một chút có thể sử dụng bít cuối cùng của mỗi byte màu RGB làm bit LSB.
Vậy có 3 bit LSB.
Tuy nhiên, phương pháp này cũng có nhiều hạn chế, chẳng hạn như không đảm
bảo được tính bền vững của thông tin giấu đối với các thao tác biến đổi như quay ảnh
hoặc nén ảnh JPEG.
1.4.2 Tiếp cận trên miền tần số ảnh
Trong một số trường hợp cách khảo sát trực tiếp ở trên cũng gặp phải khó khăn
nhất định hoặc rất phức tạp và hiệu quả không cao, do đó ta có thể dùng phương pháp
khảo sát gián tiếp thông qua các kỹ thuật biến đổi. Các biến đổi này làm nhiệm vụ
chuyển miền biến số độc lập sang miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ
được biểu diễn trong miền mới với các biến số mới.
11

Mỗi cách biến đổi sẽ có những thuận lợi riêng, tùy từng trường hợp mà sử dụng
biến đổi nào. Sau khi khảo sát, biến đổi xong các tín hiệu và hệ thống rời rạc trong
miền các biến số mới này, nếu cần thiết có thể dùng các biến đổi ngược để đưa chúng
về miền biến số độc lập.
Phương pháp khảo sát gián tiếp sẽ làm đơn giản rất nhiều các công việc gặp phải
khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập tự nhiên. Hệ thống
rời rạc cần khảo sát chính là không gian các điểm ảnh. Có nhiều phép biến đổi trong
đó phổ biến là biến đổi Fourier DFT, biến đổi Cosin rời rạc DCT, biến đổi sóng nhỏ
DWT… Đây là những phép biến đổi được sử dụng nhiều trong các kỹ thuật xử lý ảnh.
Trong giấu tin, nó cũng được sử dụng, đặc biệt trong các kỹ thuật thủy vân.
12

 Bước 1: Chia ma trận M thành các khối nhỏ B
i
kích thước K = m x n
 Bước 2: Giấu bit dữ liệu b
i
vào khối B
i
.
For each B
i

if sum(B
i
)

b
i
(mod 2) then giữ nguyên khối B
i
.
else B’
i


đảo bit bất kì trong B
i
.
End;
13

Hình 1.4. Thay đổi bit trong khối B
Khi đó ta có sum(B’) = 7, do đó ta được sum(B’)  1 (mod 2).
(b) Giả sử ta giấu bit b = 0 vào khối B.
Ta có sum(B) = 8, nên sum(B)  0 (mod 2). Khối B được bảo toàn và bit dữ liệu
b = 0 coi như đã được giấu.
Trong thuật toán giấu tin này, khóa đơn giản chỉ là kích thước khối. K = m x n.
Nếu biết kích thước của khối thì ta dễ dàng giải mã theo quy tắc sau.
3) Quá trình tách tin
Input - F’ là ảnh đã được giấu dãy bit bí mật D
- K là khóa bí mật, đó là kích thước khối nhỏ đã được xác định trước
Output - F là file ảnh chứa tin đã được giấu
- D là dãy bit bí mật đã giấu
Các bước thực hiện
- Đọc header ảnh để biết các thông tin về ảnh, đọc bảng mầu, đọc phần dữ liệu
ảnh vào ma trận hai chiều M
- Chia M thành các khối nhỏ với kích thước K.
- Theo một thứ tự xác định trước, xét từng khối nhỏ B, giải tin theo quy tắc sau
- Nếu tổng số các bit 1 là lẻ thì ta thu được bit giấu là 1
- Nếu tổng số các bit 1 là chẵn thì ta thu được các bit giấu là 0.
Như vậy, sau khi xử lý hết các khối đã giấu ta thu được chuỗi bit đã giấu b’
Chuyển file xâu bit nhị phân sang file văn bản.
0 1 0 0

 Bản chất của kỹ thuật giấu tin trong ảnh đen trắng đó là một quy ước nào
đó dưới dạng một mệnh đề (tân từ) P. Nếu tân từ P được thỏa thì ứng với bit 1, ngược
lại ứng với bit 0. Tân từ P trong thuật toán trên là sum(B)  b (mod 2).
1.5.1.4 Áp dụng thuật toán cho ảnh màu và ảnh đa cấp xám
Nhược điểm cơ bản của phương pháp giấu tin vào ảnh đen trắng là tin giấu vào
đó được rất ít. Nếu giấu nhiều thông tin thì ảnh sẽ thay đổi và người ta dễ dàng phát
hiện ra sự có mặt của thông tin ẩn. Do đó khi giấu tin mật người ta thường chọn ảnh
màu hoặc ảnh đa cấp xám. Với ảnh màu và ảnh đa cấp xám, mỗi điểm ảnh được biểu
diễn bằng nhiều bít. Trong dãy các bít này có một bít được gọi là bít ít quan trọng nhất
(LSB – Least Significant Bit). LSB là bit mà khi ta đảo giá trị của nó thì điểm màu chỉ
bị thay đổi ít nhất. Thí dụ với ảnh đa cấp xám, mỗi mức xám g được biểu diễn bởi số
nguyên không âm, thì mức xám g sẽ sai khác ít nhất so với hai mức xám liền kề là g–1
và g+1. Trong trường hợp này bít LSB chính là bit thấp nhất trong dạng biểu diễn nhị
phân của g. Hầu hết các thuật toán giấu tin trên ảnh mầu hoặc ảnh đa cấp xám đều áp
dụng gián tiếp thuật toán giấu tin trên ảnh đen trắng theo sơ đồ sau:
16

 Bước 1: Tạo ảnh đen trắng F từ ảnh mầu Fc bằng một kỹ thuật nào đó. Chẳng hạn
lấy từ mỗi điểm màu trong Fc một bít quan trọng nhất để làm một điểm ảnh cho F.
 Bước 2: Giấu tin vào ảnh đen trắng F để thu được ảnh đen trắng F’.
 Bước 3: Đưa lại các bit của F’ vào mỗi điểm ảnh màu tương ứng của Fc để thu
được ảnh màu kết quả là F’c.
Như vậy, thuật toán giấu tin trong ảnh đen trắng là cơ sở cho các thuật toán giấu
tin nói chung.

17

1.5.2 Kỹ thuật giấu tin Wu _ Lee
1.5.2.1 Ý tưởng chính của thuật toán
Kỹ thuật giấu tin theo khối bit sử dụng tính chẵn lẻ của tổng số bit 1 trong khối ở

Định nghĩa 1.3:
Phép nhân theo vị trí trên hai ma trận A và B (các phần tử là các số nguyên) có
cùng kích thước như sau:
A  B = C, trong đó C[i,j] = A[i,j] * B[i,j]
Định nghĩa 1.4:
Với ma trận số B ta định nghĩa sum(B) là tổng tất cả các phần tử của ma trận B.
Nếu B là ma trận bit thì sum(B) chính là tổng số các bit 1 có trong B.
Ý tưởng thuật toán
Với mục tiêu là giấu được càng nhiều thông tin vào trong ảnh mà vẫn đảm bảo
được chất lượng ảnh càng tốt, ý tưởng chính của thuật toán là chia ảnh ra thành các
khối bằng nhau, tìm khối nào ít bị phát hiện nhất, giấu một bit thông tin vào khối đó.
1.5.2.2 Thuật toán
1) Quá trình giấu tin
Input:
 Ảnh nhị phân F
 Khóa bí mật K
 Xâu bit dữ liệu cần giấu D
Output:
 Một file ảnh F’ đã giấu tin bên trong.
Cách thức thực hiện:
Bước 1: Chia ảnh F thành các khối nhỏ F
i
, mỗi khối có kích thước K (K = m x n).
Bước 2:
For each F
i

If 0< sum(F
i
 K) < sum(K) then

 K) = sum(K) – 1 then
Chọn ngẫu nhiên một bit [j, k] thỏa F
i
[j, k] = 1 và K[j, k] = 1.
Đảo giá trị của bit F
i
[j, k] = 0
else
Chọn ngẫu nhiên một bit [j, k] mà K[j, k] = 1
Đảo giá trị của bit F
i
[j, k] từ 1 thành 0 hoặc từ 0 thành 1.
End if;
Thí dụ:
Giả sử ta cần giấu dãy bit D = “101” vào ảnh F có kích thước 8x8 và một ma trận
khóa K có kích thước 4x4 như hình vẽ dưới đây. Ta chia ảnh F thành 4 khối nhỏ F
1
,
F
2
, F
3
, F
4
, mỗi khối nhỏ sẽ có kích thước là 4x4.
20 (a) (b)


0

1 0 1 0

1

0 1 0

0

1

1

0

1

1

1

1

0 1 0 0

0

1 0 1


0

1

0

10 0 0 0

0

1 0 1

1

0

1

0

0

0

0

0


0

1

0

1

0 1 0 1

0

1 0 1

1

0

1

0

0

1

0

0


0

1

0

1

0 1 0 1

0

1 0 1F
3F
4

K F
3
K F
4
K
1

0

1

1

1

1 1

1

1

1

1

1

0

0

0 0

1

0

1

1

1

1

1 1

0

1

0

1

F'
4Hình 1.6. Minh họa giấu dữ liệu D = “101” vào 4 khối ảnh nhị phân


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status