CHƯƠNG I :
TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN TRONG ĐA
PHƯƠNG TIỆN
Đa phương tiện (Multimedia) là nhiều hệ thống truyền thông, các dữ liệu
hay các thông tin đa phương tiện gồm: text (văn bản), graphic (hình họa),
animation (hoạt ảnh), Image(ảnh chụp), video, audio.
1.1. Giấu tin trong dữ liệu đa phương tiện:
Giấu tin như thế nào?
Cùng với sự phát triển của Internet và các phương tiện multimedia, nhiều
vấn đề như: ăn cắp bản quyền, xuyên tạc thông tin, truy cập thông tin trái phép…
cũng tăng theo, đòi hỏi phải tìm ra các giải pháp mới, hữu hiệu cho an toàn và bảo
mật thông tin. Một trong các giải pháp nhiều triển vọng là giấu tin(Data Hiding),
đã và đang được nghiên cứu và ứng dụng.
Giấu thông tin là kỹ thuật nhúng(embedding) một lượng thông tin số nào
đó vào trong một đối tượng dữ liệu số khác. Sự khác biệt giữa mã hóa thông tin và
giấu thông tin là mã hóa làm cho các thông tin hiện rõ là nó có được mã hóa hay
không, còn với giấu thông tin thì sẽ khó phát hiện ra được rằng có thông tin giấu
bên trong.
Yêu cầu cơ bản của việc giấu tin là đảm bảo tính chất ẩn của thông tin
được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc.
Hiện tại thì giấu tin chia làm hai hướng lớn, đó là watermark(thủyvân), và
steganography. Phương pháp thủy vân quan tâm đến ứng dụng giấu các mẩu tin
ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu trước các biến đổi
thông th ường của tệp dữ liệu môi trường. Trong khi đó, phương pháp
Steganography quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật và
dung lượng càng lớn càng tốt.
Mục đích của giấu tin có hai khía cạnh chính:
Trang 1
Bảo mật cho dữ liệu đem giấu(embedded data), chẳng hạn như giấu thông
tin mật trong một đối tượng nào đó sao cho người khác không phát hiện được.
Đảm an toàn bảo mật cho chính đối tượng được dùng để giấu dữ liệu
những vấn đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên
tạc trái phép…đây là lúc công nghệ giấu tin được chú ý và phát triển.
Giấu thông tin là một kĩ thuật nhúng thông tin vào trong một nguồn đa
phương tiện gọi là các phương tiện chứa mà không gây ra sự nhận biết về sự tồn
tại của thông tin giấu. Phương pháp giấu tin là làm cho người ta khó có thể biết
được có thông tin giấu bên trong đó do tính chất ẩn của thông tin được giấu.
1.2.1.Mục đích của giấu tin
Giấu tin có hai mục đích:
- Bảo mật cho những dữ liệu được giấu
- Bảo đảm an toàn (bảo vệ bản quyền) cho chính các đối tượng chứa dữ
liệu giấu trong đó.
Có thể thấy hai mục đích này hoàn toàn trái ngược nhau và dần phát triển
thành hai lĩnh vực với những yêu cầu và tính chất khác nhau.
Hình 1.1: Hai lĩnh vực chính của kỹ thuật giấu thông tin
Kỹ thuật giấu thông tin bí mật (Steganography): với mục đích đảm bảo an
toàn và bảo mật thông tin tập trung vào các kỹ thuật giấu tin để có thể giấu được
nhiều thông tin nhất. Thông tin mật được giấu kỹ trong một đối tượng khác sao
cho người khác không phát hiện được.
Trang 3
Giấu thông tin
Giấu tin bí mật
(Steganography)
Thuỷ vân số
(Watermarking)
Kỹ thuật giấu thông tin theo kiểu đánh giấu (watermarking) để bảo vệ bản
quyền của đối tượng chứa thông tin tập trung đảm bảo một số các yêu cầu như
đảm bảo tính bền vững… đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số.
1.2.2. Mô hình kỹ thuật giấu thông tin cơ bản
g tin
Phân
phối
Hình 1.2: Lược đồ chung cho quá trình giấu tin
Tách thông tin từ các phương tiện chứa diễn ra theo quy trình ngược lại với
đầu ra là các thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau
khi tách lấy thông tin có thể được sử dụng, quản lý theo những yêu cầu khác nhau.
Trang 5
Phương tiện
chứa (audio,
ảnh, video)
Phương tiện chứa đã
được giấu tin
Bộ
giải
mã
tin
Thông tin giấu
Kiể
m
địn
h
Khóa giấu
tin
Hình 1.3: Lược đồ chung cho quá trình giải mã
Hình vẽ 1.3 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận
được đối tượng phương tiện chứa có giấu thông tin, quá trình giải mã được thực
hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá
của quá trình nhúng. Kết quả thu được gồm phương tiện chứa gốc và thông tin đã
giấu. Bước tiếp theo thông tin đã giấu sẽ được xử lý kiểm định so sánh với thông
mạng. Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng.
Việc nhận thực cũng như phát hiện thông tin xuyên tạc đó trở nên vô cùng
quan trọng, cấp thiết. Và một đặc điểm của giấu thông tin trong ảnh đó là thông
tin được giấu trong ảnh đó là thông tin được giấu trong ảnh một cách vô hình, nó
như là một cách mà truyền thông tin mật cho nhau mà người khác không thể biết
được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi đặc
biệt đối với ảnh mầu hay ảnh xám. Gần đây báo chí đã đưa tin vụ
việc ngày 11-9 gây chấn động nước Mĩ và toàn thế giới, chính tên trùm khủng bố
quốc tế Osma BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên lạc
với đồng bọn, và hắn đã qua mặt được cục tình báo trung ương Mĩ CIA và các cơ
quan an ninh quốc tế.
Chắc chắn sau vụ việc này, thì việc nghiên cứu các vấn đề liên quan đến
giấu thông tin trong ảnh sẽ rất được quan tâm.
Trang 7
b. Giấu thông tin trong audio:
Giấu thông tin trong audio mang những đặc điểm khác so với giấu thông
tin trong các đối tượng đa phương tiện khác. Một trong những yêu cầu cơ bản của
giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh
hưởng đến chất lượng của dữ liệu gốc. Khác với kĩ thuật giấu thông tin trong ảnh
phụ thuộc vào hệ thống thị giác thì kĩ thuật giấu thông tin trong audio lại phụ
thuộc vào hệ thống thính giác HAS.
Một vấn đề khó khăn ở đây là hệ thống thính giác của con người nghe
được các tín hiệu ở các giải tần rộng và công suất lớn nên đã gây khó dễ đối với
các phương pháp giấu tin trong audio. Nhưng thật may là HAS lại kém trong việc
phát hiện sự khác biệt các dải tần và công suất, điều này có nghĩa là các âm thanh
to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng. Các mô
hình phân tích tâm lí đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc
chọn các audio thích hợp cho việc giấu tin. Vấn đề khó khăn thứ hai đối với giấu
thông tin trong audio là kênh truyền tin. Kênh truyền hay băng thông chậm sẽ ảnh
hưởng đến chất lượng thông tin sau khi giấu. Ví dụ để nhúng một đoạn java applet
Phương pháp chèn dữ liệu: Phương pháp này tìm các vị trí trong file dễ bị
bỏ qua và chèn dữ liệu cần giấu vào đó, cách giấu này không làm ảnh hưởng gì tới
sự thể hiện các file dữ liệu ví dụ như được giấu sau các ký tự EOF.
Phương pháp tạo các phương tiện chứa: Từ các thông điệp cần chuyển sẽ
tạo ra các phương tiện chứa để phục vụ cho việc truyền thông tin đó, từ phía
người nhận dựa trên các phương tiện chứa này sẽ tái tạo lại các thông điệp.
1.2.5. Phân loại theo các mục đích sử dụng
- Giấu thông tin bí mật: đây là ứng dụng phổ biến nhất từ trước đến nay, đối
với giấu thông tin bí mật người ta quan tâm chủ yếu tới các mục tiêu:
+ Độ an toàn của giấu tin - khả năng không bị phát hiện của giấu tin.
+ Lượng thông tin tối đa có thể giấu trong một phương tiện chứa cụ thể mà
vẫn có thể đảm bảo an toàn
+ Độ bí mật của thông tin trong trường hợp giấu tin bị phát hiện
Trang 9
- Giấu thông tin bí mật không quan tâm tới nhiều các yêu cầu bền vững của
phương tiện chứa, đơn giản là bởi người ta có thể thực hiện việc gửi và nhận
nhiều lần một phương tiện chứa đã được giấu tin
- Giấu thông tin thuỷ vân: do yêu cầu bảo vệ bản quyền, xác thực… nên giấu tin
thuỷ vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là các dấu hiệu
thuỷ vân đủ bền vững trước các tấn công vô hình hay cố ý gỡ bỏ nó. Thêm vào đó
các dấu hiệu thuỷ vân phải có ảnh hưởng tối thiểu (về mặt cảm nhận) đối với các
phương tiện chứa. Như vậy các thông tin cần giấu càng nhỏ càng tốt.
Tuỳ theo các mục đích khác nhau như bảo vệ bản quyền, chống xuyên tạc
nội dung, nhận thực thông tin,… thuỷ vân cũng có các yêu cầu khác nhau
Các kỹ thuật giấu tin mới được phát triển mạnh trong khỏang mười năm
trở lại đây nên việc phân loại các kỹ thuật còn chưa hoàn toàn thống nhất. Sơ đồ
phân loại do F.Petitcolas đưa ra năm 1999 được nhiều người chấp nhận.
Trang 10
Robust Watermarking
Thuỷ vân bền vững
vào sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm
bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm. Yêu cầu
kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản
phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ
còn cách là phá huỷ sản phẩm.
1.3.2. Nhận thực thông tin hay phát hiện xuyên tạc thông tin
(authentication and tamper detection):
Trang 11
Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được sử
dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không.
Các thuỷ vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa việc làm
giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét.
Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc
cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa
phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ bị
nén mất dữ liệu). Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin
cao và thuỷ vân không cần bền vững.
1.3.3. Giấu vân tay hay dán nhãn (fingerprinting and labeling):
Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người gửi
hay người nhận của một thông tin nào đó. Ví dụ như các vân khác nhau sẽ được
nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều
người. Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các
thuỷ vân tránh sự xoá giấu vết trong khi phân phối.
1.3.4. Điều khiển truy cập (copy control):
Các thuỷ vân trong những trường hợp này được sử dụng để điều khiển truy
cập đối với các thông tin. Các thiết bị phát hiện ra thuỷ vân thường được
gắn sẵn vào trong các hệ thống đọc ghi. Ví dụ như hệ thống quản lí sao chép
DVD đã được ứng dụng ở Nhật. Các ứng dụng loại này cũng yêu cầu thuỷ vân
phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã
giấu mà không cần thông tin gốc.
Header 128 bytes
Bảng màu mở rộng
Dữ liệu ảnh nén
Hình 2.1: Cấu trúc ảnh PCX
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
+ 1 byte: chỉ ra kiểu định dạng. Nếu là kiểu PCX/PCC nó có giá trị là 0Ah.
+ 1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:
- 0: version 2.5.
- 2: version 2.8 với bảng màu.
- 3: version 2.8 hay 3.0 không có bảng màu.
- 5: version 3.0 có bảng màu.
+ 1 byte: chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo phương
pháp BYTE PACKED, nếu không là phương pháp RLE.
+ 1 byte: số bit cho một điểm ảnh plane.
+ 1 word: toạ độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là (0,0);
còn PCC thì khác (0,0).
+ 1 word: toạ độ góc phải dưới.
+ 1 word: kích thước bề rộng và bề cao của ảnh.
+ 1 word: số điểm ảnh.
+ 1 word: độ phân giải màn hình.
+ 1 word.
+ 48 byte: chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
+ 1 byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, với
ảnh 256 màu (1 pixel/ 8 bit) thì số bit plane lại là 1.
+ 1 byte: số bytes cho một dòng quét ảnh.
+ 1 word: kiểu bảng màu.
+ 58 byte: không dùng.
nút bấm và các hình màu. GIF là định dạng nén dữ liệu đặc biệt hữu ích cho việc
truyền hình ảnh qua đường truyền lưu lượng nhỏ. Đây là một giải pháp tốt cho
hình ảnh trên mạng, cho các hoạt hình nhỏ và ngắn.
GIF sử dụng thuật toán nén LOSS LESS (Không mất dữ liệu), điều đó cho
phép chúng tạo ra kích thước nhỏ mà không bị mất hoặc mờ bất kỳ chi tiết nào
của ảnh dữ liệu
GIF note
GIF header (7 byte)
Globel Palette
Header Image (10 byte)
Palette of Image (nếu có)
Data of Image 1
‘,’ ký tự liên kết
…………………..
‘;’ terminator
Trang 17