Nghiên cứu một số phương pháp bảo vệ bản quyền âm thanh và ứng dụng - Pdf 25



ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

HẢI PHÒNG - 2011 2
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS. TRỊNH NHẬT TIẾN HẢI PHÒNG - 2011 1
MỤC LỤC
MỤC LỤC 1
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT 4
DANH SÁCH HÌNH VẼ 5
MỞ ĐẦU 6
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN 7
1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN 7
1.1.1. Vấn đề An toàn thông tin 7
1.1.2. Mục tiêu của An toàn thông tin 8
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin. 8
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ 9

2.1.3. Nhóm các phƣơng pháp giao thoa tín hiệu gốc 33
2.1.3.1. Nhận xét chung 33
2.1.3.2. Phương pháp mã hóa pha 34
2.1.3.3. Phương pháp điều biến pha 34
2.1.4. Nhóm các phƣơng pháp không giao thoa tín hiệu gốc 35
2.1.4.1. Nhận xét chung 35
2.1.4.2. Nhóm các phương pháp trải phổ 35
2.1.4.3. Nhóm phương pháp tập đôi (two - set method) 43
2.1.4.4. Nhóm các phương pháp sử dụng bản sao 44
2.1.4.5 Nhóm các phương pháp tự đánh dấu 48
2.2. CHỮ KÝ SỐ 50
2.2.1. Khái niệm “chữ ký số” 50
2.2.1.1. Giới thiệu “chữ ký số” 50
2.2.1.2. Sơ đồ “chữ ký số” 51
2.2.2. Phân loại “chữ ký số” 52
2.2.2.1. Phân loại chữ ký theo đặc trưng kiểm tra chữ ký 52
2.2.2.2. Phân loại chữ ký theo mức an toàn 52
2.2.2.3. Phân loại chữ ký theo ứng dụng đặc trưng 52
2.2.3. Một số loại chữ ký số 53

3
2.2.3.1. Chữ ký RSA 53
2.2.3.2. Chữ ký Elgamal 54
2.2.3.3. Chữ ký DSS 56
2.3. MỘT SỐ KHẢ NĂNG TẤN CÔNG BẢN QUYỀN ÂM THANH 59
2.3.1. Phân loại các kiểu tấn công 59
2.3.2. Một số kiểu tấn công bản quyền âm thanh 59
2.3.2.1. Tấn công đơn giản 59
2.3.2.2. Tấn công gây nhập nhằng 60
2.3.2.3. Tấn công hình học 60

BPSK
Binary Phase Shift Keying
Điều chế khoá chuyển
pha cơ số 2
3
CBR
Constant Bitrate
Tốc độ bit không đổi
4
dB
Decibel
Đơn vị âm thanh
5
DFT
Discrete Fourier Transform
Biến đổi Fourier rời rạc
6
DS
Direct Sequence
Chuỗi trực tiếp
7
FFT
Fast Fourier Transform
Biến đổi Fourier nhanh
8
HAS
Human Auditory System
Hệ thính giác người
9
ISS

17
WAV
Waveform Audio File Format
File âm thanh không nén
18
WMA
Windows Media Audio
File âm thanh nén 5
DANH SÁCH HÌNH VẼ
Hình 1: Biến đổi sóng âm thanh thành tín hiệu số
14
Hình 2: Hình minh hoạ cho sóng của tín hiệu
17
Hình 3: Nhiễu đều
18
Hình 4: Nhiễu phân bố Gaussian
18
Hình 5: Đáp ứng xung
21
Hình 6: Mạch thanh ghi dịch cơ số 2
23
Hình 7: Mô hình giả lập hệ thính giác

24
Hình 8: Phương pháp phân loại thủy vân
30
Hình 9: Phân loại Watermarking trên Audio
6
MỞ ĐẦU
Ngày nay sự phát triển mạnh mẽ của Internet cùng với cuộc cách mạng thông
tin số đã đem lại những bước phát triển vượt bậc trong xã hội. Truyền thông băng
tần rộng cùng với các định dạng dữ liệu số phong phú hiện nay đã mở ra nhiều cơ
hội cũng như không ít thách thức. Các thiết bị số, các phần mềm xử lý đa phương
tiện ngày càng mạnh mẽ hiện đại, dễ dàng sử dụng dẫn đến vấn nạn xâm phạm bản
quyền như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản
quyền,…ngày càng trở nên phổ biến và tinh vi. Theo kết quả thống kê của Hiệp hội
bảo vệ tác quyền thế giới (International Intellectual Property Alliance - gọi tắt là
IIPA), mỗi năm ngành công nghiệp giải trí nói chung và âm nhạc nói riêng thất
thoát hàng ngàn tỉ đô-la.Các nước đang phát triển có tỉ lệ vi phạm bản quyền rất cao
(trên 90%), trong đó Việt Nam dẫn đầu (với 92% ). Tuy nhiên với các phương pháp
bảo vệ dữ liệu truyền thống như mã hoá, sử dụng khóa đều không đem lại hiệu quả
cao trong tình hình hiện nay. So với các loại truyền thông đa phương tiện khác, âm
thanh số là dạng dữ liệu rất khó bảo vệ bởi đặc tính thu – phát trực tiếp.
So với các loại truyền thông sử dụng tín hiệu tương tự truyền thống thì
truyền thông số ngày nay mang lại rất nhiều lợi ích: dung lượng lớn, thao tác đơn
giản (sao chép, lưu trữ, phát tán),… Tuy nhiên đó cũng là những điểm hạn chế để
nạn vi phạm bản quyền tấn công. Trong các phương tiện giải trí số đang tồn tại ở
nước ta hiện nay : game, hình ảnh, video, thì âm thanh có thể được xem là hình
thức giải trí thông dụng và gần gũi nhất. Trên cở sở các kiến thức đã có đề tài tập
trung tìm hiểu, nghiên cứu, so sánh đánh giá các phương pháp bảo vệ bản quyền âm
thanh số (chủ yếu vào hai hướng chính là “Giấu tin” -Steganography và “Thuỷ ấn
số” -Watermarking ) và một số các phương pháp tấn công bản quyền âm thanh số.

7
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN

- Bảo đảm toàn vẹn: Ngăn cản, hạn chế việc tạo mới, bổ sung, xóa hay sửa
dữ liệu mà không được sự uỷ thác.
- Bảo đảm xác thực: Xác thực đúng nguồn gốc thông tin, hay xác thực sự
toàn vẹn của thông tin.
- Bảo đảm sẵn sàng: Thông tin sẵn sàng cho người dùng hợp pháp.
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin.
+ Kỹ thuật Diệt trừ: VIRUS máy tính, chương trình trái phép,…
+ Kỹ thuật Tường lửa (Firewall): Ngăn chặn truy cập trái phép, lọc thông tin
không hợp pháp.
+ Kỹ thuật Mạng riêng ảo (Virtual Private Network)
+ Kỹ thuật Giấu tin (Information Hiding)
+ Kỹ thuật Truy tìm dấu vết trộm tin.
+ Kỹ thuật Mật mã.

9
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ
1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố
1/.Tính chia hết
Xét 2 số nguyên a và b. Ta gọi a chia hết cho b số nguyên n thỏa mãn
a=b*n. Khi đó a được gọi là bội số của b, b được gọi là ước số của a. Ký hiệu a|b.
a được gọi là chia cho b dư r số nguyên k và r thỏa mãn a = k.b + r. Khi
đó r gọi là số dư của phép chia a cho b.
Xét dãy số ( a
1,
a
2
,… a
n
).
Nếu b là ước số chung của tất cả các số trong dãy số trên, và tất cả các ước

).
Ta có: gcd (a, b) = 1 với mọi a và b nguyên tố cùng nhau.
2/.Quan hệ đồng dư
a và b đồng dư theo modulo n (a - b)|r.
Ký hiệu a b (mod n).
3/.Số nguyên tố
Số nguyên tố là số tự nhiên lớn hơn 1, chỉ chia hết cho 1 và chính nó.
Các số tự nhiên không phải là số nguyên tố thì gọi là hợp số.
Số nguyên tố đóng một vai trò rất quan trọng trong lĩnh vực an toàn thông
tin. Ví dụ: số nguyên tố là tham số để tính các khoá mật mã

10
Số lượng các số nguyên tố là vô hạn, đồng thời cho đến nay người ta vẫn
chưa tìm ra được quy luật của dãy số nguyên tố.
Số nguyên tố đã được nghiên cứu từ trước Công nguyên. Hiện nay, đã có rất
nhiều thuật toán được nghiên cứu nhằm xác định một số có phải là số nguyên tố hay
không.
Gần đây nhất, vào tháng 8 năm 2008, đã tìm ra số nguyên tố có gần 13 triệu
chữ số, là một số nguyên tố dạng Mersenne.
1.2.2. Không gian và cấu trúc nhóm
1/.Không gian và các phép tính cơ bản:
được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n.
= {1, 2, … n - 1}.
* được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n và nguyên tố cùng
nhau với n.
*= {x|x , gcd (x, n) = 1}.
Trong không gian , các phép toán đều được thực hiện theo modulo n.
Phép cộng, phép trừ và phép nhân được thực hiện bình thường như trong
không gian Z, tuy nhiên kết quả cuối cùng phải được tính lại theo modulo n.
Phép chia trong không gian liên quan tới khái niệm phần tử nghịch đảo.

 Thời gian thực hiện thuật toán.
Trong các tiêu chí đó, tiêu chí thời gian thực hiện thuật toán là quan trọng
nhất.
12
Độ phức tạp thời gian của thuật toán, thường được hiểu là số các phép tính
cơ bản mà thuật toán phải thực hiện, trong trường hợp xấu nhất. Với cỡ dữ liệu đầu
vào là n, thời gian thực hiện thuật toán là t(n) được gọi là tiệm cận tới hàm f(n) nếu
với n đủ lớn thì tồn tại số c thỏa mãn t(n) c.f(n). Nếu f(n) là một hàm đa thức thì
thuật toán được gọi là có độ phức tạp thời gian đa thức.
Hiện nay, hầu hết các bài toán giải được trong thực tế đều là các bài toán có
độ phức tạp thời gian đa thức. Các bài toán có độ phức tạp số mũ thực tế là khó thể
giải được (có thể mất nhiều triệu tới nhiều tỷ năm).
Lý thuyết độ phức tạp tính toán là lý thuyết quan trọng của khoa học máy
tính. Nó cũng là cơ sở cho các phép toán gần đúng và xấp xỉ, hiện đang có nhiều
ứng dụng trong khoa học.
Từ lý thuyết độ phức tạp tính toán, xuất hiện một khái niệm rất quan trọng
trong lĩnh vực an toàn thông tin: hàm một phía và hàm một phía có cửa sập.
Hàm một phía (one way function): hàm số y = f(x) được gọi là hàm một
phía, nếu khi biết giá trị của x thì ta dễ dàng tính được giá trị của y, nhưng ngược
lại, nếu biết giá trị của y, ta “khó” tính được giá trị của x.

13
1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH
Âm thanh số (digital audio) là kết quả của quá trình biến đổi từ sóng âm
thanh thành tín hiệu số. Sóng âm thanh là các sóng cơ học có dạng hình sin tuần
hoàn liên tục (analog), trong khi “âm thanh số” chỉ là những xung điện tử rời rạc
(digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một

Ví dụ: với âm thanh 16 bit, ta cần sử dụng 16bit hay 2byte cho một mẫu (8bit
= 1byte). Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh
âm thanh) sẽ có độ lớn là 44100x2=88200byte.
Nếu cũng với các thông số như vậy nhưng thay vì mono, ta sử dụng stereo (2
kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte. Đây là lý do
vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1, 7.1,
…) lớn hơn rất nhiều sơ với âm thanh stereo hay mono mặc dù chúng cũng có được
nén ở cùng chất lượng. Hình 1: Biến đổi sóng âm thanh thành tín hiệu số

15
- BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễn bằng một
lượng bit dữ liệu nhất định, gọi là BitDepth. Các bản nhạc hiện nay thường có
BitDepth là 16 bits, 24 bits…BitDepth càng lớn âm thanh càng sắc nét, trung thực
nên nó còn được gọi là Resolution (độ nét).
- Kênh âm thanh (Channel): Bằng các thuật toán, tín hiệu số sẽ được tách ra
thành nhiều kênh sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như
khi đang nghe nhạc trong không gian thực tế.
- Âm thanh Lossy, lossless và uncompressed
Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương
pháp nén nào. Được sử dụng dưới định dạng WAV hay PCM.
Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ
liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn
giữ được chất lượng như ban đầu. Âm thanh xử lý lossless sẽ có bitrate thấp hơn so
với âm thanh chưa nén.Âm thanh lossless được sử dụng rộng rãi và phát triển thành
những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real
Audio
Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm

1.4.1. Đại cƣơng về tín hiệu và nhiễu
1.4.1.1 Khái niệm tín hiệu
Tín hiệu là sự biến thiên của biên độ theo thời gian. Biên độ có thể là điện
áp, dòng điện, công suất, . . . nhưng thường được hiểu là điện áp. Các yếu tố trong
tín hiệu mà chúng ta thường nhắc tới là biên độ và thời gian.
Ví dụ: Xét sóng của tín hiệu x = sin(2*pi *100 *t) .

Hình 2: Hình minh hoạ cho sóng của tín hiệu
1.4.1.2 Khái niệm nhiễu
Nhiễu là tín hiệu do chính bản thân mạch điện tử và môi trường truyền thông
phát sinh ra. Giảm nhiễu hoặc khử nhiễu là thao tác chính trong xử lý tín hiệu số.
Nhiễu trắng là nhiễu có độ lớn như nhau ở mọi tần số (trên lý thuyết), trong thực tế
chúng ta chỉ xét trong phạm vi giới hạn băng tần khá rộng hay nói đúng hơn nhiễu
trắng là tín hiệu có mật độ công suất phổ (PSD) cố định ở mọi băng tần.
Có hai loại phân bố xác suất của nhiễu thường nhắc tới là nhiễu phân bố đều
và nhiễu Gauss.
+ Phân bố đều là phân bố có hàm mật độ PDF f(x) không đổi trong khoảng
biến thiên của biến số x, có giá trị kỳ vọng là μ = 0 .
+ Phân bố Gauss là phân bố chuẩn. Dạng nhiễu phổ biến nhất trong thực tế
là nhiễu trắng có phân bố Gauss.

18 Hình 3: Nhiễu đều
Hình 4: Nhiễu phân bố Gaussian


kn
N
j
k
enxX


với k = 0, 1,. , N-l. Đây là phép biến đôi Fourier thuận, ký hiệu DFT.
X
K
được gọi là hệ số phổ.
Ngược lại, tín hiệu tổng hợp từ các hệ số phổ là:
kn
N
j
N
k
k
eX
N
nx

2
1
0
1
)(




enxX











1
0
2
sin
2
cos)(
N
kn
N
jkn
N
nx
Vậy phần thực, phần ảo, biên độ và pha lần lượt là
 
)(

R












1.4.2.3. Ứng dụng
o Phân tích phổ - rò rỉ phổ
Phân tích phổ số là phân ly tín hiệu số thành các thành phần tần số. Đây là
một kỹ thuật rất hữu ích trong khoa học công nghệ. Chúng ta nên phân biệt phân
tích phổ và lọc, phân tích phổ đơn giản là phân tích, kiểm nghiệm tín hiệu chứ
không lọc. Đối tượng của phân tích phổ là các tín hiệu trong tự nhiên như là: tiếng
nói, tín hiệu địa chất, tín hiệu sinh học, dữ liệu thị trường. Phân tích phổ còn được
áp dụng cho việc khảo sát các hệ thống như hệ thống lọc.
Lọc tín hiệu ra khỏi miền nhiễu Dùng DFT và FFT là cách hiệu quả để phát
hiện tín hiệu chìm trong nền nhiễu. Ví dụ: một tín hiệu sóng vuông bị chìm trong
nhiễu, bề ngoài chúng ta rất khó xác định được chúng. Qua FFT, năng lượng tín
hiệu sẽ tập trung ở một số phổ vạch, còn nhiễu thì trải rộng, nhờ đó chúng ta có thể
phát hiện ra tín hiệu. 21
o Đáp ứng cửa số

Đáp ứng xung của hệ thống H là tín hiệu ra h(t), tín hiệu vào là một xung lực
đơn vị
)(t
. Vì xung lực ở t = 0 nên đáp ứng xung cũng bắt đầu ở t = 0. Hình 5: Đáp ứng xung

Đáp ứng xung :





n
jn
enhH )()(22
1.4.3. Lý thuyết trải phổ
1.4.3.1. Định nghĩa trải phổ
Trải phổ là kỹ thuật truyền tín hiệu, được sử dụng rộng rãi trong truyền
thông. Trong đó năng lượng của tín hiệu được “trải” trên một băng thông rộng hơn
nhiều lần lượng băng thông cần thiết tối thiểu nhờ sử dụng mã giả ngẫu nhiên, mã
này độc lập với tín hiệu thông tin. Bên nhận thông tin sẽ tiến hành “giải trải” bằng
cách đồng bộ hóa mã giả ngẫu nhiên.
Có 4 kiểu trải phổ:
 Trải phổ trực tiếp
 Nhẩy tần

1
gxgxgxgxg
m
m
m
m
m
m





(1)
Trong đó g
i
có giá trị là 0 hoặc 1 và g
m
= g
0
= 1.
Cho g(x) = 0 . Ta có sự hồi quy như sau:
1 =
m
m
m
m
xgxgxgxg 





 )(
cTk
kTtc
c

(5)

Trích đoạn Nhóm các phương pháp sử dụng bản sao Tấn công đơn giản Tấn công hình học
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status