Tìm hiểu kỹ thuật nhúng thông tin để bảo vệ bản quyền cơ sở dữ liệu quan hệ - Pdf 24


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

NGUYỄN MINH KHÔI

Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số : 60.48.01

TÌM HIỂU KỸ THUẬT NHÚNG
THÔNG TIN ĐỂ BẢO VỆ BẢN QUYỀN CƠ SỞ
DỮ LIỆU QUAN HỆ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC:

PGS.TS BÙI THẾ HỒNG


Nguyễn Minh Khôi

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iii
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Tìm hiểu kỹ thuật nhúng thông tin để bảo
vệ bản quyền cơ sở dữ liệu quan hệ” này là công trình nghiên cứu của riêng
tôi. Các số liệu sử dụng trong luận văn là trung thực. Các kết quả nghiên cứu
đƣợc trình bày trong luận văn chƣa từng đƣợc công bố tại bất kỳ công trình
nghiên cứu nào khác.
Nguyễn Minh Khôi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iv
MỤC LỤC
LỜI CẢM ƠN i
LỜI CAM ĐOAN iii
DANH MỤC CÁC HÌNH VẼ ….vi
1. Đặt vấn đề. 1
2. Đối tƣợng và phạm vi nghiên cứu. 2

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

v
2.1.1.1 Nhúng tin bằng kỹ thuật thay thế bit có trọng số thấp nhất. 22
2.1.1.2 Các phép biến đổi miền không gian ảnh sang miền tần số. 26
2.1.1.3 Kỹ thuật sinh chuỗi giả ngẫu nhiên 30
2.1.1.4 Các kỹ thuật trải phổ trong truyền thông 31
2.2. Giải thuật nhúng đề xuất 33
2.3. Giải thuật giải nhúng 41
2.4 Bảng hợp trƣớc các loại tấn công 43
2.4.1 Xóa ngẫu nhiên bản ghi 44
2.4.2 Sửa đổi bảng ghi 45
2.4.3 Chèn bản ghi 47
CHƢƠNG III: THỬ NGHIỆM GIẢI THUẬT ĐỀ XUẤT 48
3.1 Dữ liệu cho thử nghiệm 48
3.2 Xây dựng chƣơng trình thử nghiệm 50
3.2.1Tổ chức, cài đặt giải thuật 51
3.2.2 Hoạt động của chƣơng trình 52
KẾT LUẬN 55
PHỤ LỤC 57
1. Mã
xác
thực thông tin (
M
A
C) 57
2. Hàm băm 58
TÀI LIỆU THAM KHẢO: 63

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Hình 2.2.2 Minh họa dữ liệu kết quả học tập của sinh viên 35
Hình 2.2.3 Bảng hợp lƣu dữ liệu để nhúng tin 35
Hình 2.2.4: Hình mô phỏng bảng hợp chứa thông tin tìm kiếm, xác định dữ
liệu. 36
Hình: 2.2.5: Minh họa bảng hợp vào các bít sẽ nhúng………… ……………… 39
Hình 2.2.6: Bảng sinh viên sau khi nhúng tin…………………………… 40
Hình 2.2.7 Bảng Kết quả học tập sau khi nhúng tin…………………… 40
Hình 2.3.1: Bảng bit sau giải nhúng ……………………………………… 43
Hình 2.4.1.1: Bảng kết quả học tập sau khi bị xóa một số bản ghi ……… 45
Hình 2.4.1.2: Bảng bit thu đƣợc từ giải nhúng sau khi CSDL bị xóa bản
ghi………… 45
Hình 2.4.2.1: Bảng kết quả học tập sau khi bị sửa một số bản ghi ………… 46
Hình 2.4.2.2: Bảng bit thu đƣợc từ giải nhúng sau khi CSDL bị sửa bản ghi
……………………………………………………………………………….46
Hình 3.1.1: Biểu diễn tổ chức, lƣu trữ thông tin trong CSDL thử nghiệm 48
Hình 3.1.2: Mối liên giữa bảng dữ liệu sinh viên và bảng điểm kết quả học tập
50
Hình 3.2.1: Giao diện kết nối tới CSDL 52
Hình 3.2.2: Giao diện chọn bảng 53
Hình 3.2.3: Giao diện xác định các trƣờng lấy thông tin 54
Hình 3.2.4 : Thao tác nhúng và tách nhúng. 54
Hình 4.1. Sơ đồ hoạt động của MAC 57
Hình 4.2. Mô tả quá trình xác thực thông tin bằng MAC 58
Hình 4.3. Biểu diễn hàm băm 61 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1
LỜI MỞ ĐẦU

tin khác,

trong đó ứng dụng phổ biến của nó là cung cấp
bằng
chứng về
bản quyền tác giả của các dữ liệu số
bằng
cách nhúng các thông tin bản
quyền. Rõ
ràng
trong ứng dụng này, thông tin nhúng cần phải
bền
vững
trƣớc các thao tác nhằm loại bỏ
chúng.
Trong thời đại bùng nổ thông tin hiện nay, cơ sở dữ liệu quan hệ gặp
các nguy cơ tấn công là không thể tránh khỏi.
Do lo ngại ngày càng tăng về
việc vi phạm bản quyền cơ sở dữ liệu quan hệ, nên việc quản lý quyền kỹ
thuật số của cơ sở dữ liệu đang trở thành một lĩnh vực nghiên cứu cực kỳ
quan trọng. Gần đây đã đƣợc một số công trình tiên phong trong lĩnh vực này

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2
giúp xác lập quyền sở hữu cơ sở dữ liệu quan hệ. Giải pháp đƣợc đƣa ra chính
là sử dụng kỹ thuật nhúng thông tin vào cơ sở dữ liệu để cá nhân, tổ chức xác
nhận quyền làm chủ sở hữu cơ sở dữ liệu mình. Trƣớc hết hãy xem xét kịch
bản ngƣời mua-ngƣời bán chung một chủ sở hữu của cơ sở dữ liệu đƣợc bán
cho nhiều khách hàng khác nhau. Đối với trƣờng hợp này, rõ ràng vấn đề

DỮ LIỆU
CHƢƠNG III: THỬ NGHIỆM GIẢI THUẬT ĐỀ XUẤT
KẾT LUẬN
5. Phƣơng pháp nghiên cứu.
 Về lý thuyết:
+ Đọc tài liệu để tìm hiểu về cơ sở dữ liệu quan hệ, kỹ thuật nhúng
thông tin bảo vệ bản quyền sản phẩm số nói chung và cơ sở dữ liệu quan hệ
nói riêng.
+ Tìm hiểu cơ sở toán học và phƣơng pháp xây dựng mô hình cho bài
toán nhúng thông tin để bảo vệ bản quyền cơ sở dữ liệu quan hệ.
 Về thực nghiệm:
+ Áp dụng các thuật toán trên cho mô hình cơ sở dữ liệu để minh họa.
6. Ý nghĩa khoa học của đề tài.
 Trong thời đại ngày nay việc an toàn quyền sở hữu thông tin là
một nhu cầu cập bách không thể xa rời. An toàn sở hữu thông tin ở đây chính
là bảo vệ thông tin không bị sao chép trái phép, không bị thay đổi ở mọi hình
thức xuyên tạc hay bóp méo sự thật. Mà quan trong hơn cả là khẳng định
quyền làm chủ thông tin, mà đặc biệt hơn nữa trong quyền sở hữu thông tin
chính là quyền sở hữu cơ sở dữ liệu quan hệ. Bởi vì mọi cá nhân,cơ quan, tổ
chức, tồn tại trong xã hội thông tin thì thông tin của mình đều đƣợc lƣu trữ
trong cơ sở dữ liệu quan hệ. Một khi cơ sở dữ liệu đó bị xâu phạm, bị biến đổi
mà ta không thể nào chứng thực lại thông tin gốc trong cơ sở dữ liệu thì điều

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

4
gì sẽ xẩy ra Chính vì thề mà các kỹ thuật để chứng thực quyền sở hữu cơ
sở dữ liệu quan hệ đang đƣợc nhiều tổ chức đầu tƣ nghiên cứu, trong dó kỹ
thuật nhúng thông tin để bảo vệ cơ sở dữ liệu quan hệ đang đƣợc nhiều tổ
chức ứng dụng.

Copyright) hơn là chính tác giả. Copyright trƣớc nhất là dùng để bảo vệ các
đầu tƣ về kinh tế.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

6
Tại Việt Nam, Quyền tác giả tại Việt Nam đã đƣợc quy định chi tiết trong
Bộ Luật Dân sự 2005, Luật Sở hữu trí tuệ và Nghị Định 100/NĐ-CP/2006
của Chính phủ quy định chi tiết và hƣớng dẫn thi hành một số điều của Bộ
luật Dân sự Luật Sở hữu trí tuệ về quyền tác giả và quyền liên quan. Theo đó,
Quyền tác giả là quyền của tổ chức, cá nhân đối với tác phẩm do mình sáng
tạo hoặc sở hữu, bao gồm các quyền sau đây:

1. Quyền Nhân thân
- Đặt tên cho tác phẩm
- Đứng tên thật hoặc bút danh trên tác phẩm; đƣợc nêu tên thật hoặc
bút danh khi tác phẩm đƣợc công bố, sử dụng;
- Công bố tác phẩm hoặc cho phép ngƣời khác công bố tác phẩm;
- Bảo vệ sự toàn vẹn của tác phẩm, không cho ngƣời khác sửa chữa, cắt
xén hoặc xuyên tạc tác phẩm dƣới bất kỳ hình thức nào gây phƣơng hại đến
danh dự và uy tín của tác giả.

2. Quyền tài sản
- Làm tác phẩm phái sinh;
- Biểu diễn tác phẩm trƣớc công chúng;
- Sao chép tác phẩm;
- Phân phối, nhập khẩu bản gốc hoặc bản sao tác phẩm;
- Truyền đạt tác phẩm đến công chúng bằng phƣơng tiện hữu tuyến, vô
tuyến, mạng thông tin điện tử hoặc bất kỳ phƣơng tiện kỹ thuật nào khác;
- Cho thuê bản gốc hoặc bản sao tác phẩm điện ảnh, chƣơng trình máy

nhúng thông tin thì ngƣời ta sẽ khó biết đƣợc là có thông tin giấu bên trong.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

8

Hình 1.1. Sơ đồ biểu diễn quá trình nhúng tin

Hình 1.2. Sơ đồ biểu diễn quá trình giải mã
Hai sơ đồ trên hình 1.1 và 1.2 biểu diễn quá trình nhúng tin và quá trình giải
tin.

1.2.2 Phân loại các kỹ thuật nhúng tin
Kỹ thuật nhúng thông tin số mới đƣợc hình thành trong thời gian gần đây
nên xu hƣớng phát triển chƣa ổn định. Nhiều phƣơng pháp mới, theo nhiều
khía cạnh khác nhau. Hình minh họa dƣới đây là sơ đồ phân loại sau đây
đƣợc Fabien A. P. Petitcolas đề xuất năm 1999.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9

Hình 1.3. Phân loại kỹ thuật nhúng tin

Dựa trên việc thống kê các công trình đã công bố trên các tạp chí,
cùng với thông tin về tên và tóm tắt nội dung của các công trình đã công bố
trên Internet, ngƣời ta chia lĩnh vực nhúng tin ra làm hai hƣớng lớn, đó là
watermarking và steganography.
Steganography quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ
bí mật cao và dung lƣợng lớn.

sản

phẩm.
Giả sử
có một thành phẩm dữ liệu dạng đa phƣơng tiện nhƣ ảnh, âm thanh, video
cần đƣợc lƣu thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi
lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào
sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm
bảo không để lại một ảnh hƣởng lớn nào đến việc cảm nhận sản phẩm. Yêu
cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng
với sản phẩm, muốn bỏ thuỷ vân này mà không đƣợc phép của ngƣời chủ sở
hữu thì chỉ còn cách là phá huỷ sản phẩm.
- Xác thực thông tin và phát hiện xuyên tạc thông tin (authentication

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11
and tamper detection): Một tập thông tin sẽ đƣợc nhúng trong phƣơng
tiện chứa, sau đó đƣợc sử dụng để nhận biết dữ liệu trên phƣơng tiện gốc
có bị thay đổi hay không. Các thuỷ vân nên đƣợc ẩn để tránh sự tò mò
của đối phƣơng, hơn nữa việc làm giả các thuỷ vân
hợp

lệ
hay xuyên tạc
thông tin nguồn cũng cần xem xét.Trong các ứng dụng thực tế, ngƣời ta
mong muốn tìm đƣợc vị trí bị xuyên tạc cũng nhƣ phân biệt đƣợc các thay
đổi (ví dụ nhƣ phân biệt một đối tƣợng đa phƣơng tiện chứa thông tin
nhúng đã bị thay đổi, xuyên tạc nội dung hay chỉ bị nén mất dữ liệu).Yêu
cầu chung đối với ứng dụng này là khả năng nhúng thông tin cao và thuỷ vân

Tự động kiểm tra việc truyền nhận sóng vô tuyến. Ví dụ một robot có
thể “nghe” một trạm thu phát sóng radio và tìm kiếm những dấu hiệu để biểu
thị một phần cụ thể của bản nhạc hoặc lời quảng cáo vừa đƣợc phát ra.
-

Việc mở rộng dữ liệu- để thêm thông tin mang lại lợi ích một cách
công khai.
-

Ứng dụng trong lấy dấu vân tay (cho phép nhận dạng dữ liệu đã
phân tán).

1.4 Môi trƣờng nhúng tin
Kỹ thuật nhúng tin đã đƣợc nghiên cứu và áp dụng trong nhiều môi
trƣờng dữ liệu khác nhau nhƣ trong dữ liệu đa phƣơng tiện (text, image,
audio, video), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên
môi trƣờng cơ sở dữ liệu quan hệ. Trong các môi trƣờng dữ liệu đó thì dữ liệu
đa phƣơng tiện là môi trƣờng chiếm tỉ lệ chủ yếu trong các kỹ thuật nhúng tin.

1.4.1 Trong văn bản
Nhúng thông tin bí mật vào trong văn bản là một kỹ thuật nhúng tin đơn
giản và đƣợc phát triển sớm nhất. Kỹ thuật này có ngƣời còn hiểu đó nhƣ
phần mật mã thông tin. Kỹ thuật này tận dụng những thuộc tính của văn bản,
thay đổi một số thuộc tính văn bản theo quy ƣớc để che giấu thông tin bên
trong. Tuy nhiên đi kèm với sự đơn giản là dễ bị tấn công, gỡ bỏ hoặc làm sai
lệch thông tin đƣợc giấu.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

13


14
đảm bảo yêu cầu này, kỹ thuật nhúng thông tin trong ảnh phụ thuộc vào hệ
thống thị giác của con ngƣời - HVS (Human Vision System) còn kỹ thuật
nhúng thông tin trong audio lại phụ thuộc vào hệ thống thính giác HAS
(Human Auditory System). Và một vấn đề khó khăn ở đây là hệ thống
thính giác của con ngƣời nghe đƣợc các tín hiệu ở các giải tần rộng và công
suất lớn nên đã gây khó dễ đối với các phƣơng pháp nhúng tin trong audio.
Nhƣng thật may là HAS lại kém trong việc phát hiện sự khác biệt các dải tần
và công suất điều này có nghĩa là các âm thanh to, cao tần có thể che giấu
đƣợc các âm thanh nhỏ thấp một cách dễ dàng. Các mô hình phân tích tâm
lí đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các audio
thích hợp cho việc nhúng tin.
Vấn đề khó khăn thứ hai đối với nhúng thông tin trong audio là
kênh truyền tin. Kênh truyền hay băng thông chậm sẽ ảnh hƣởng đến chất
lƣợng thông tin sau khi nhúng. Nhúng thông tin trong audio đòi hỏi yêu cầu
rất cao về tính đồng bộ và tính an toàn của thông tin. Các phƣơng pháp
nhúng thông tin trong audio đều lợi dụng điểm yếu trong hệ thống thính giác
của con ngƣời.

1.4.4 Trong video
Cũng giống nhƣ nhúng thông tin trong ảnh hay trong audio, nhúng tin
trong video cũng đƣợc quan tâm và đƣợc phát triển mạnh mẽ cho nhiều ứng
dụng nhƣ điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản
quyền tác giả. Các kỹ thuật nhúng tin trong video cũng đƣợc phát triển mạnh
mẽ và cũng theo hai khuynh hƣớng là thuỷ vân số và datahiding. Một
phƣơng pháp nhúng tin trong video đƣợc đƣa ra bởi Cox là phƣơng pháp
phân bố đều. Ý tƣởng cơ bản của phƣơng pháp là phân phối thông tin nhúng
dàn trải theo tần số của dữ liệu chứa gốc. Một số nhà nghiên cứu khác đã
dùng những hàm Cosin riêng và các hệ số truyền sóng riêng để nhúng tin.

khoán, dữ liệu về hành vi của khách hàng, dữ liệu y học và khoa học.
Việc nhúng thuỷ vân vào dữ liệu quan hệ có thể thực hiện đƣợc bởi trong

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

16
thực tế, các dữ liệu thật có thể chấp nhận một dung sai nhỏ mà vẫn không
ảnh hƣởng đáng kể đến giá trị sử dụng của chúng.
Cho đến nay, mới có một vài cách tiếp cận đối với bài toán thuỷ vân
dữ liệu quan hệ đƣợc đề xuất. Tuy nhiên, những kỹ thuật này không bền
vững đối với các tấn công thủy vân. Phần tiếp theo của đề tài này xin đề
xuất một kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ mới [1], [2], [6],[7].
Nhúng tin là một công nghệ mới rất phức tạp, nó đang đƣợc các nhà
khoa học tập trung nghiên cứu ở nhiều nƣớc trên thế giới. Tuy nhiên,
những kết quả thực nghiệm cho thấy để thực sự ứng dụng thực tế thì lĩnh
vực này cần phải có thêm thời gian để nghiên cứu và thẩm định.
Trong luận văn này ta đề cập tới vấn đề chính là nhúng tin vào cơ sở dữ
liệu nên trong phần tiếp theo, chúng ta sẽ chi tiết hơn về tình hình nghiên cứu
kỹ thuật này.

1.5 Tình hình nghiên cứu kỹ thuật nhúng tin vào cơ sở dữ liệu
Cho đến nay, các nhà khoa học ở Việt Nam đã có một số công trình đã
đƣợc công bố trong đó có áp dụng kỹ thuật nhúng tin (thuỷ vân), trong đó
chủ yếu tập trung vào các lĩnh vực nhƣ thuỷ vân audio, thuỷ vân video, thuỷ
vân ảnh. Các công trình nghiên cứu về thuỷ vân cơ sở dữ liệu vẫn còn
hạn chế và đang đƣợc tiếp tục nghiên cứu tuy nhiên vẫn chƣa nhiều về số
lƣợng các công trình. Các công trình về nhúng tin vào (thuỷ vân) sơ sở dữ
liệu thông thƣờng nghiên cứu theo một số hƣớng nhƣ sau:
Phƣơng pháp sử dụng các bít trọng số nhỏ LSB khá đơn giản cho việc
cài đặt, tuy nhiên thông tin đƣợc nhúng không bền vững trƣớc nhiều hình

từng ứng dụng cụ thể.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

18
1.5.2 Theo kiểu biến dạng (Distortion)
Ý tƣởng cơ bản của nghiên cứu này là: Tất cả các bộ đƣợc phân
hoạch một cách bí mật thành g nhóm thông qua hàm băm H(K,r.P). Một
dấu thuỷ vân (watermark) khác đƣợc nhúng vào mỗi nhóm, vì vậy bất kỳ
một thay đổi nào trên dữ liệu đều có thể đƣợc nhận dạng và định vị với độ
chính xác cao tới cấp nhóm [16].

1.5.3 Theo độ nhạy (Sensitivity)
Hệ thống thuỷ vân có thể đƣợc phân thành hai dạng là bền vững và dễ
bị phá huỷ thông qua độ nhạy của chúng đối với các tấn công cơ sở dữ liệu
+ Bền vững (Robust watermarks) đƣợc sử dụng cho bảo vệ bản quyền,
chứng mình quyền sở hữu, hoặc chống lại sự sao chép lậu.
+ Dễ bị phá huỷ (Fragile watermarks) đƣợc sử dụng để định vị và
phát hiện sự giả mạo dữ liệu.
a. Thủy vân bền vững
Cho B(k;m,p) là xác suất có nhiều hơn k thành công trong m phép thử
Bernoulli.
Một dấu thuỷ vân đƣợc nhận dạng nếu có nhiều hơn một tỉ lệ phần
trăm T các bit đã nhúng đƣợc nhận dạng chính xác [9].
b. Thủy vân dễ vỡ
Thuỷ vân đƣợc tính toán bằng cách băm tất cả các bộ thành các nhóm
Bất kỳ thay đổi nào tới dữ liệu đều có thể đƣợc nhận dạng chi tiết.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status