KHOA CÔNG NGHỆ THÔNG TIN
ĐẠI HỌC THÁI NGUYÊN
NGUYỄN NGỌC TRUNG
CÁC THUẬT TOÁN TỐI ƢU HÓA
TRONG BẢO MẬT THÔNG TIN
CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH
MÃ SỐ : 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC
NGÀNH CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TSKH. NGUYỄN XUÂN HUY
Thái Nguyên 03/2008
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn tới Khoa CNTT – ĐHTN, nơi các thầy cô đã
tận tình truyền đạt các kiến thức quý báu cho tôi trong suốt quá trình học tập.
Xin cảm ơn Ban chủ nhiệm khoa và các cán bộ đã tạo điều kiện tốt nhất cho
chúng tôi học tập và hoàn thành đề tài tốt nghiệp của mình.
Các tài liệu, số liệu tham khảo đƣợc trích dẫn đầy đủ nguồn gốc. Tôi
xin chịu trách nhiệm trƣớc pháp luật lời cam đoan của mình.
Học viên thực hiện
Nguyễn Ngọc Trung
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
MỤC LỤC
Trang
LỜI CẢM ƠN
LỜI CAM ĐOAN
MỤC LỤC
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
MỞ ĐẦU 1
5
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT CRT Chinese Remainder Theorem
DES Data Encryption Standard
RSA Rivest ShamirAdleman
GCD Great Comon Divisor
FFT Fast Fourier Transform
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
MỞ ĐẦU
1. Lý do chọn đề tài
Các hệ mã công khai nhƣ RSA thực hiện tính toán với các số nguyên
lớn hàng trăm chữ số. Độ phức tạp trong việc giải mã các hệ mã này tỉ lệ
thuận với độ lớn của các số nguyên tham gia vào việc tạo khóa mã hóa và
khóa công khai. Do đó để hệ mã an toàn, cần tăng kích thƣớc của các số
nguyên.
Mặt khác, khi kích thƣớc của các số nguyên cần xử lý lớn thì thời gian
xử lý của chƣơng trình mã hóa cũng tăng lên.
Thông tin cần mã hóa ngày càng đa dạng và có khối lƣợng lớn, đòi hỏi
hệ mã giảm thiểu thời gian xử lý.
Các công cụ và giải thuật nhằm bẻ khóa các hệ mật mã đƣợc cải tiến đòi
hỏi hệ mã cần đƣợc nâng cấp tính bảo mật.
Tuy nhiên, việc nghiên cứu và triển khai các nâng cấp trong việc tối ƣu
hóa về mặt thuật toán trong các phép xử lý số học của các hệ mã còn hạn chế
- Phát hiện các giải thuật tính toán cần tối ƣu hóa.
- Thực hiện đƣa ra giải pháp tối ƣu hóa các giải thuật này.
- Ứng dụng trong một hệ mã cụ thể.
- So sánh với kết quả thực thi của hệ mã khi chƣa thực hiện tối ƣu hóa.
3. Phƣơng pháp nghiên cứu
- Nghiên cứu dựa trên việc tìm hiểu các giải thuật xử lý với số nguyên lớn
của các hệ mã. Cụ thể là hệ mã hóa RSA, từ kết quả nghiên cứu có đƣợc sẽ định
hƣớng lựa chọn thuật toán nào cần tối ƣu hóa.
- Thực hiện việc tối ƣu hóa các giải thuật bằng cách tối ƣu các phép xử lý với
số học lớn. Thao tác này sử dụng kết hợp các phƣơng pháp tính toán với số học
nhằm tăng hiệu năng của từng bƣớc xử lý.
- Thu thập các tài liệu đã xuất bản, các bài báo trên các tạp chí khoa học và
các tài liệu trên mạng Internet có liên quan đến vấn đề đang nghiên cứu.
- Tìm hiểu, vận dụng và kế thừa các thuật toán và qui trình mã đã công bố
kết quả.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
- Thực nghiệm cài đặt ứng dụng để minh họa các vấn đề trình bày
trong đề tài.
4. Đối tƣợng và phạm vi nghiên cứu
Đối tượng nghiên cứu :
Các hệ mật mã khóa công khai, trong đó hệ mật mã RSA đƣợc sử dụng
làm đối tƣợng nghiên cứu chính của đề tài nhằm phát hiện các phép xử lý toán
học cần tối ƣu. Từ các kết quả thu đƣợc bƣớc đầu đề tài đƣa ra một cách xây
dựng thử nghiệm hệ mã RSA áp dụng các kết quả tối ƣu hóa.
Phạm vi nghiên cứu
Đề tài thực hiện việc tối ƣu hóa với một số phép tính toán với số nguyên
lớn.
Ứng dụng thử nghiệm trong một hệ mã nhằm so sánh hiệu năng xử lý của
1.1 Một số khái niệm cơ bản về mã hóa.
1.2 Lý thuyết độ phức tạp của thuật toán.
1.3 Các phép xử lý số học cơ bản – Cơ sở toán học của mật mã.
Chƣơng 2: Các thuật toán xử lý số học trong các hệ mã thông dụng.
2.1 Giới thiệu về hệ mật mã với khóa công khai.
2.2 Hệ mật mã công khai RSA.
2.3 Hệ mật mã công khai RSA with CRT.
2.4 Phân tích cơ chế hoạt động của hệ mã RSA.
2.5 Các phép xử lý số học trong hệ mã RSA.
2.6 Khả năng bị bẻ khóa của hệ mã công khai RSA.
2.7 Hệ mật mã khóa công khai ELGAMAL.
Chƣơng 3: Tối ƣu hóa một số giải thuật xử lý số học
trong một hệ mã cụ thể.
3.1 Phân tích các giải thuật xử lý số học trong hệ mã RSA
3.2 Tối ƣu hóa các giải thuật để xử lý với các số nguyên lớn.
Chƣơng 4: Ứng dụng kết quả trong một hệ mã hóa cụ thể.
4.1 Xây dựng ứng dụng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
4.2 Kiểm nghiệm và so sánh kết quả đạt đƣợc trƣớc và sau khi tối ƣu
hóa.
Chƣơng 5: Kết luận.
5.1 Đánh giá và nêu ƣu nhƣợc điểm của đề tài.
5.2 Định hƣớng phát triển đề tài.
7. Đóng góp của luận văn
- Luận văn hệ thống các cơ sở lý thuyết cơ bản về hệ mật mã khóa công khai.
- Xây dựng chƣơng trình thử nghiệm ứng dụng bảo mật và xác thực trong
giảng dạy. Từ đó có thể mở rộng và hoàn thiện thêm một số chức năng để đƣa vào
ứng dụng trong thực tiễn.
ban đầu đƣợc áp dụng nhiều trong lĩnh vực quân đội. Các phƣơng pháp mã hóa cổ
điển đã đƣợc áp dụng nhƣ Caesar, Playfair, …
Các hệ mật mã cổ điển đƣợc sử dụng nhiều nhƣng dần dần chúng bộc lộ một
hạn chế lớn. Do các cách mã hóa đều dựa trên phƣơng pháp mã khóa bí mật, khi gửi
bản mã đi thì cần phải gửi kèm theo cả cách giải mã. Bên cạnh đó, nếu cách mã hóa
là quen thuộc hoặc đơn giản thì ngƣời có đƣợc thông tin đã bị mã hóa có thể tiến
hành các cách để dò ra luật mã hóa để có đƣợc văn bản gốc.
Ngày nay cũng với sự trợ giúp của máy tính điện tử, các phƣơng pháp mã hóa
với khóa bí mật đƣợc sử dụng chung cho quá trình mã hóa và giải mã (hay còn gọi
là mã hóa cổ điển) có thể dễ dàng bị giải mã.
Sự cần thiết phải có các phƣơng pháp mã hóa an toàn hơn đã đƣợc đáp ứng
bằng việc áp dụng các kết quả nghiên cứu của toán học. Sự thay đổi về phƣơng
pháp mã hóa cũng nhƣ độ an toàn của các hệ mã mới đã đƣa lịch sử của mật mã học
sang trang mới. Các hệ mật mã với khóa mã đối xứng đã góp phần to lớn trong việc
củng cố vai trò của mật mã học trong các ứng dụng của con ngƣời. Đƣa mật mã đến
với cả các ứng dụng trong cuộc sống đời thƣờng của con ngƣời, mật mã không còn
chỉ đƣợc nhắc đến nhiều trong lĩnh vực quân sự. Ứng của mật mã học đã trở thành
một công cụ cần thiết cho mọi ngƣời, cần thiết cho các hoạt động thƣờng ngày.
Các phƣơng pháp mã hóa khác nhau có những ƣu, nhƣợc điểm khác nhau. Khi
sử dụng các phƣơng pháp mã hóa, ngƣời dùng sẽ cân nhắc để lựa chọn phƣơng
pháp mã hóa thích hợp nhất đối với mình. Có thể lựa chọn môi trƣờng cần phải an
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
toàn tuyệt đối bất kể thời gian và chi phí hoặc lựa chọn môi trƣờng lại cần giải pháp
dung hòa giữa bảo mật và chi phí.
Các mô hình mã hóa có chung một số thuật ngữ nhƣ sau:
Bản rõ: Là nội dung của thông điệp cần gửi đi và cần đƣợc bảo vệ an toàn. Nó
có thể là xâu các bít, các file văn bản, các file có cấu trúc.
Mã hoá: Là quá trình xử lý thông điệp cần bảo mật trƣớc khi gửi đi.
dung thông điệp gốc (D
K
(C) = P).
1.1.2. Những yêu cầu đối với hệ mật mã hiện đại
Hệ mật mã hiện đại cần đảm bảo đƣợc hai yêu cầu sau:
- Đảm bảo tính bảo mật.
- Đảm bảo tính xác thực.
Bảo mật: Ngăn không để ngƣời lạ thực hiện việc trích chọn, sửa đổi thông tin
từ các bản mã đƣợc gửi trên các kênh truyền phổ biến (thƣờng không an toàn).
Xác thực: Đảm bảo chỉ có ngƣời nhận đúng mới có thể giải mã nội dung bản
mã, đồng thời cũng đảm bảo ngƣời gửi không thể phủ nhận nội dung đã gửi.
1.1.3 Các phƣơng pháp mã hóa
1.1.3.1 Hệ thống mã hóa đối xứng
Cả hai quá trình mã hóa và giải mã của hệ thống mã hóa đối xứng đều sử
dụng chung một khóa bí mật. Do đó, khi bị mất khóa bí mật này thì tính bảo mật
của hệ mã bị phá vỡ.
Ban đầu, bản rõ đƣợc ngƣời gửi A mã hóa với khóa k. Sau đó bản mã đƣợc
gửi tới ngƣời nhận B. Khi nhận đƣợc bản mã, ngƣời B sử dụng khóa k giải mã để
thu đƣợc bản rõ. Do đó, nếu một ngƣời khác có đƣợc khóa k thì hệ thống mã hóa
này sẽ bị tấn công. (Hình 1.1) Hình 1.1: Sơ đồ hoạt động của mã hóa khóa đối xứng
Các hệ mật mã nhƣ DES, 3DES-Triple DES đƣợc xây dựng trên phƣơng
pháp mã hóa khóa đối xứng.
Bản mã
Bản rõ
Các lý thuyết toán học dựa trên cơ sở khai thác những ánh xạ f mà việc thực
hiện ánh xạ ngƣợc f
-1
rất khó so với việc thực hiện ánh xạ f đƣợc sử dụng trong
các phƣơng pháp mã hóa này. Việc thực hiện ánh xạ ngƣợc f
-1
chỉ tiến hành đƣợc
khi biết đƣợc khóa riêng. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17 Hình 1.2 Sơ đồ hoạt động của mã hóa khóa bất đối xứng
Khi thực hiện mã hóa bất đối xứng, ngƣời A sử dụng khóa công khai do ngƣời
B tạo để mã hóa thông điệp và gửi cho ngƣời B. Do biết đƣợc khóa riêng nên B mới
có thể giải mã đƣợc thông điệp mà A đã mã hóa. Trong trƣờng hợp bản mã bị một
ngƣời thứ ba có đƣợc, nếu chỉ kết hợp với thông tin về khóa công khai đã đƣợc
công bố, cũng rất khó có khả năng giải mã đƣợc bản mã này trong khoảng thời gian
chấp nhận đƣợc do không nắm đƣợc khóa riêng của B.
Khóa công khai và khóa riêng có quan hệ toán học với nhau theo nghĩa từ
khóa riêng có thể tính toán để suy ra đƣợc khóa công khai, nhƣng để từ khóa công
khai suy ra khóa riêng sẽ rất phức tạp vì số lƣợng phép tính toán là rất lớn dẫn đến
thời gian thực hiện để giải mã là không khả thi khi chiều dài của khóa đủ lớn.
Đây cũng là mấu chốt của vấn đề bảo mật và tấn công trong các hệ mã khóa
công khai. Đề tài này sẽ đề cập đến vấn đề an toàn của hệ mã công khai. Nghiên
nói f(n) có bậc O-lớn của g(n), và viết f(n) = O(g(n)) hoặc f=O(g), nếu tồn tại một
hằng số C > 0 sao cho với n đủ lớn. Ta có 0 < f(n) < Cg(n).
Định nghĩa 1.2:
Một thuật toán đƣợc gọi là có độ phức tạp đa thức, hoặc có thời gian đa thức,
nếu số các phép tính cần thiết khi thực hiện thuật toán không vƣợt quá O(log
k
n),
trong đó n là độ lớn của đầu vào, và k là số nguyên dƣơng nào đó.
Nói cách khác, nếu đầu vào là các số m-bit thì thời gian thực hiện thuật toán là
O(m
d
), tức là tƣơng đƣơng với một đa thức của m.
Các thuật toán với thời gian O(α
n
), α > 1, đƣợc gọi là các thuật toán với độ
phức tạp mũ, hoặc thời gian mũ.
Một thuật toán có độ phức tạp O(g), thì cũng có thể nói nó có độ phức tạp O(h)
với mọi hàm h > g. Tuy nhiên, ta luôn luôn cố gắng tìm ƣớc lƣợng tốt nhất có thể
đƣợc để tránh hiểu sai về độ phức tạp thực sự của thuật toán.
Tồn tại những thuật toán có độ phức tạp trung gian giữa đa thức và mũ. Các
thuật toán đó đƣợc gọi là thuật toán dƣới mũ.
Độ phức tạp không phải là tiêu chuẩn duy nhất để đánh giá thuật toán. Có
những thuật toán, về lý thuyết thì có độ phức tạp cao hơn một thuật toán khác,
nhƣng khi sử dụng lại cho kết quả nhanh hơn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
Bảng dƣới đây đƣa ra các thông số về thời gian và số lƣợng phép toán trên bit
để thực hiện việc phân tích một số nguyên n ra thừa số nguyên tố áp thuật toán tốt
nhất trên máy tính có tốc độ xử lý một triệu phép tính trên một giây:
năm
300
1,5.10
29
4,9.10
15
năm
500
1,3.10
39
4,2.10
25
năm
Dễ nhận thấy rằng với một thuật toán dƣới mũ, thời gian làm việc với các số
nguyên lớn vẫn không khả thi. Do đó, với các ứng dụng xử lý số lớn, ta thƣờng phải
cố gắng biến đổi để thu đƣợc một thuật toán có thời gian tính toán đa thức. Ý tƣởng
này sẽ đƣợc áp dụng trong phần nghiên cứu của để tài để xử lý cho các phép toán số
học với số lớn trong các hệ mã hóa công khai.
1.2.2 Các bài toán khó tính toán và ứng dụng trong mật mã học
Một hệ mật phải cố gắng gây khó khăn cho ngƣời giải mã khi không biết khóa
giải nhƣng lại dễ dàng giải mã khi biết đƣợc khóa giải mã.
Một hệ mã nhƣ vậy sẽ có một thông tin “cửa sập” bí mật đƣợc chèn thêm vào
bài toán dựa trên tính khó khăn khi thực hiện nghịch đảo một hàm một chiều.
Định nghĩa 1.3:
Cho các tập hữu hạn S, T. Hàm f : S
T đƣợc gọi là hàm một chiều (one-
mod N có độ
phức tạp đa thức; nhƣng tính f
-1
lại là bài toán cực khó (bài toán logarithm rời rạc).
- f
k ,N
: x x
k
mod N là hàm một chiều, với N = pq, p và q là các số nguyên tố
lớn, kk’ 1(mod φ(N)). Thực vậy, phép tính x
k
mod N có độ phức tạp đa thức,
nhƣng tính f
-1
lại cực khó. Tuy nhiên, nếu biết k’ có thể dễ dàng tính đƣợc f từ công
thức (x
k
)
k’
= x.
1.3 CƠ SỞ TOÁN HỌC CỦA MẬT MÃ
1.3.1. Hàm phi Euler
Định nghĩa 1.5
Cho n ≥1, đặt φ(n) là tập các số nguyên trong khoảng [1, n] nguyên tố cùng
nhau với n. Hàm φ nhƣ thế đƣợc gọi là hàm phi Euler.
* Tính chất của hàm phi Euler
1. Nếu p là số nguyên tố thì φ(n) = p – 1
2. Hàm phi Euler là hàm có tính nhân: Nếu gcd(m,n) = 1 thì φ(m.n) =
φ(m).φ(n). (trong đó gcd(m, n) là ký hiệu ƣớc số chung lớn nhất của m và n)
Nếu n = p
21
Định nghĩa 1.6
Cho a và b là các số nguyên, a đƣợc gọi là đồng dƣ với b theo modulo n, ký hiệu
là a b (mod n) nếu n chia hết (a-b). Số nguyên n đƣợc gọi là modulo của đồng dƣ.
* Tính chất của đồng dư: Cho a, a
1
, b, b
1
, c Z. Ta có các tính chất sau:
i. a a(mod n) (phản xạ);
ii. Nếu a b(mod n)
b a(mod n) (đối xứng);
iii. Nếu a b(mod n), b c(mod n)
a c(mod n) (bắc cầu);
iv. Nếu a a
1
(mod n), b b
1
(mod n)
a + b (a
1
+ b
1
)(mod n), ab (a
1
b
1
nsao cho a*x 1(mod n). Nếu x tồn tại thì đó là giá trị duy nhất và a đƣợc gọi là khả
nghịch, nghịch đảo của a ký hiệu là a
-1
.
- Cho a, bZ
n
. Phép chia của a cho b theo modulo n là tích của a và b
-1
theo
modulo n, và chỉ đƣợc xác định khi b có nghịch đảo theo modulo n.
* Các tính chất trong không gian Z
n
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
Cho a Z
n
, a có nghịch đảo khi và chỉ khi a và n nguyên tố cùng nhau
(gcd(a,n) = 1), trong đó gcd(a,n) là ƣớc số chung lớn nhất của a và n.
Giả sử d = gcd(a,n). Phƣơng trình đồng dƣ ax b (mod n) có nghiệm x nếu
và chỉ nếu b chia hết cho d, trong trƣờng hợp các nghiệm d nằm trong khoảng [0, n-
1] thì các nghiệm đồng dƣ theo modulo n/d.
1.3.4 Nhóm nhân Z
*
n
* Các định nghĩa trong nhóm nhân Z
*
1 (mod n).
* Các tính chất trong Z
n
*
- Cho số nguyên n ≥ 2 .
Định lý 1.1 (Euler)
Nếu a Z
n
*
thì a
φ(n)
1 (mod n).
Nếu n là tích của các số nguyên tố phân biệt và nếu r s(mod φ(n)) thì a
r
a
s
(mod n) với mọi số nguyên a. Nói cách khác, làm việc với các số theo modulo
nguyên tố p thì số mũ có thể giảm theo modulo φ(n).
Định lý 1.2 (Fermat)
Cho p là số nguyên tố.
Nếu gcd(a, p) = 1 thì a
p-1
1(mod p).
Nếu r s(mod(p-1)) thì a
r
a
s
(mod p) với mọi số nguyên a.
a
nên 0 Q
n
và 0
___
Q
n
.
* Tính chất của thặng dư
Cho n là tích của 2 số nguyên tố p và q. Khi đó a Z
n
*
là một thặng dƣ bậc 2
theo modulo n khi và chỉ khi a Q
n
và a
___
Q
n
. Ta có, |Q
n
| = |Q
p
|.|Q
q
| = (p-1)(q-1)/4
và |
___
Q
n
| = 3(p-1)(q-1)/4
n
thì a có đúng 2
k
căn bậc 2 theo modulo n.
1.3.7 Các thuật toán trong Z
n
Cho n là số nguyên dƣơng. Nhƣ đã nói ở trƣớc, các phần tử trong Z
n
đƣợc thể
hiện bởi các số nguyên {0, 1, 2,…, n-1}. Ta thấy rằng: nếu a, b Z
n
thì:
(a + b) mod n = a + b nếu a + b <n
a + b – n nếu a + b ≥ n
Vì vậy, phép cộng modulo (phép trừ modulo) có thể đƣợc thực hiện mà không
cần thực hiện các phép chia dƣ. Phép nhân modulo của a và b có thể đƣợc thực hiện
bằng phép nhân thông thƣờng a với b nhƣ các số nguyên bình thƣờng, sau đó lấy
phần dƣ của kết quả sau khi chia cho n. Phép tính nghịch đảo trong Z
n
có thể đƣợc
thực hiện nhờ sử dụng thuật toán Euclid mở rộng nhƣ mô tả sau:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
* Thuật toán tính nghịch đảo nhân trong Z
n
end.
* Thuật toán bình phương liên tiếp để tính số mũ modulo trong Z
n
.
Algorithm expmod
INPUT: a Z
n
, k N
k đƣợc biểu diễn dƣới dạng nhị phân gồm t bit: k = (k
1
, k
2
,…, k
t
)
OUTPUT: a
k
mod n
Method b := 1 ;
For i := 1 to t do
if k
i
= 1 then
b := (b * a) mod n;
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
endif
a := (a * a) mod n;
endfor;
Output [True, False] (True: n là số nguyên tố, False: n là hợp số)
1. Giả sử n = 2
k
m + 1; ( với m lẻ)
2. Chọn số ngẫu nhiên a {2, , n-1};
3. Tính b = a
m
(mod n);