i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CNTT&TT
LÊ ĐÌNH QUYẾN
NGHIÊN CỨU VẤN ĐỀ CHIA SẺ BÍ MẬT
VÀ ỨNG DỤNG TRONG BỎ PHIẾU ĐIỆN TỬ Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƢỜI HƢỚNG DẪN KHOA HỌC
PGS.TS TRỊNH NHẬT TIẾN
THÁI NGUYÊN, NĂM 2012
ii
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này của tự bản thân tôi tìm hiểu, nghiên cứu dƣới
sự hƣớng dẫn của PGS.TS Trịnh Nhật Tiến. Các chƣơng trình thực nghiệm do chính
iv
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC
LỜI CAM ĐOAN I
LỜI CẢM ƠN III
MỤC LỤC IV
DANH MỤC CÁC THUẬT NGỮ VI
DANH MỤC CÁC BẢNG VII
DANH MỤC CÁC HÌNH VIII
MỞ ĐẦU 1
CHƢƠNG 1. CÁC KHÁI NIỆM VÀ THUẬT TOÁN CƠ BẢN 3
1.1. LÝ THUYẾT TOÁN HỌC MODULO 3
1.1.1. Hàm phi Euler 3
1.1.2. Đồng dƣ thức 4
1.1.3. Không gian Z
n
5
1.1.4. Nhóm nhân Z
*
n
6
1.1.5. Thặng dƣ 7
1.1.6. Căn bậc modulo 7
1.1.7. Các thuật toán trong Z
n
8
1.1.8. Ký hiệu Legendre và ký hiệu Jacobi 10
1.2. VẤN ĐỀ MÃ HOÁ 13
3.4. Chƣơng trình thử nghiệm 65
3.4.1. Chia sẻ khóa kí phiếu bầu cử 65
3.4.2. Chia sẻ nội dung phiếu bầu cử 66
KẾT LUẬN 67
TÀI LIỆU THAM KHẢO 68
NHẬN XÉT CỦA GIÁO VIÊN HƢỚNG DẪN 69
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN 70
vi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC CÁC THUẬT NGỮ
gcd
greatest common divisor (ƣớc số chung lớn nhất)
CRT
Chinese Remainder Theorem (định lý phần dƣ Trung Hoa)
DES
Data Encryption Standard (Tiêu chuẩn mã hóa dữ liệu)
RSA
Rivest, Sharmir, Adleman
SHA
Secure Hash Algorithm (Thuật giải băm an toàn)
PKI
Public Key Infastructure (Hạ tầng khóa công khai)
CA
Certification Authority (Chứng thực chữ kí số)
DSS
Digital Signature Standard (Chuẩn chữ kí số)
vii
Internet mọi ngƣời có thể trao đổi thông tin với nhau một cách nhanh chóng và
thuận tiện. Những tổ chức có các hoạt động trên môi trƣờng Internet/Intranet phải
đối diện với vấn đề là làm thế nào để bảo vệ những dữ liệu quan trọng, ngăn chặn
những hình thức tấn công, truy xuất dữ liệu bất hợp pháp từ bên trong (Intranet) lẫn
bên ngoài (Internet). Khi một ngƣời muốn trao đổi thông tin với một ngƣời hay một
tổ chức nào đó thông qua mạng máy tính thì yêu cầu quan trọng là làm sao để đảm
bảo thông tin không bị sai lệch hoặc bị lộ do sự can thiệp của ngƣời thứ ba. Trƣớc
các yêu cầu cần thiết đó, lý thuyết về mật mã thông tin đã ra đời nhằm đảm bảo tính
an toàn dữ liệu tại nơi lƣu trữ cũng nhƣ khi dữ liệu đƣợc truyền trên mạng.
Vấn đề chia sẻ bí mật đƣợc đã đƣợc nghiên cứu từ những năm 70 của thế kỷ
trƣớc. Ý tƣởng chính của chia sẻ bí mật dựa trên nguyên tắc đơn giản là không tin
vào bất cứ ai. Để đảm bảo an toàn một thông tin nào đó thì ta không thể trao nó cho
một ngƣời nắm giữ mà phải chia nhỏ thành các mảnh và chỉ trao cho mỗi ngƣời một
hoặc một số mảnh, sao cho một ngƣời với một số mảnh mình có thì không thể tìm
ra thông tin bí mật. Việc phân chia các mảnh phải theo một sơ đồ chia sẻ bí mật
nhất định, sau đó có thể khôi phục lại thông tin bí mật ban đầu.
Đƣợc sự gợi ý của giáo viên hƣớng dẫn và nhận thấy tính thiết thực của vấn
đề, em đã chọn đề tài: Nghiên cứu vấn đề chia sẻ bí mật và ứng dụng trong “Bỏ
phiếu điện tử” để làm nội dung cho luận văn tốt nghiệp của mình.
Luận văn này tập trung vào nghiên cứu cơ sở lý thuyết toán học và một số kỹ
thuật mật mã để thực hiện chia sẻ thông tin mật, sau đó áp dụng giải quyết một số
bài toán về an toàn thông tin trong “Bỏ phiếu điện tử”.
2
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Nội dung chính của luận văn gồm ba chƣơng
Chƣơng 1: Các khái niệm cơ bản
Trong chƣơng này luận văn trình bày các kiến thức cơ bản về lý thuyết toán
Cho n ≥1. Φ(n) đƣợc định nghĩa là số các số nguyên trong khoảng [1, n]
nguyên tố cùng nhau với n. Hàm Φ đƣợc gọi là hàm phi Euler.[4 – tr79]
2/. Tính chất của hàm phi Euler
Nếu p là số nguyên tố thì Φ(n) = p – 1.
Tính nhân của hàm phi Euler: Nếu gcd(m, n) = 1 thì Φ(mn) = Φ(m)Φ(n) (trong
đó gcd(m, n) là ký hiệu ƣớc số chung lớn nhất của m và n).
Nếu
12
12
k
e
ee
k
n p p p
trong đó p
1
, p
2
, , p
k
là các thừa số nguyên tố của n thì:
12
1 1 1
( ) (1 )(1 ) (1 )
k
nn
p p p
.
(mod n), b b
1
(mod n) thì a + b a
1
+ b
1
(mod n)
và ab a
1
b
1
(mod n).
Lớp tƣơng đƣơng [1 – tr24] của một số nguyên a là tập hợp các số nguyên
đồng dƣ với a theo modul n. Từ các tính chất 2, 3 và 4 ta thấy: cho n cố định, các số
đồng dƣ với n theo modulo n trong không gian Z đƣợc xếp vào một một lớp tƣơng
đƣơng. Nếu a = qn + r, trong đó 0 ≤ r < n thì a r (mod n). Vì vậy mỗi số nguyên a
là đồng dƣ theo modul n với duy nhất một số nguyên trong khoảng từ 0 đến n – 1 và
đƣợc gọi là thặng dƣ nhỏ nhất của a theo modul n. Cũng vì vậy, a và r cùng thuộc
một lớp tƣơng đƣơng. Do đó r có thể đơn giản đƣợc sử dụng để thể hiện lớp tƣơng
đƣơng.
5
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.1.3. Không gian Z
n
1/. Các định nghĩa trong không gian Z
2/. Các tính chất trong không gian Z
n
Cho a Z
n
, a có nghịch đảo khi và chỉ khi gcd(a, n) = 1. [4 – tr83]
Ví dụ: Các phần tử khả nghịch trong Z
9
là: 1, 2, 4, 5, 7 và 8. trong đó 4
-1
= 7 vì
4 .7 1 (mod 9)
Giả sử d = gcd(a, n). Phƣơng trình đồng dƣ ax b (mod n) có nghiệm x nếu và
chỉ nếu d chia hết cho b [1 – tr25], trong trƣờng hợp các nghiệm d nằm trong
khoảng 0 đến n – 1 thì các nghiệm đồng dƣ theo modulo n / d.
3/. Định lý phần dƣ Trung Hoa (CRT)
Nếu các số nguyên n
1
, n
2
, …, n
k
là các số nguyên tố cùng nhau từng đôi một
thì hệ phƣơng trình đồng dƣ:
x a
1
(mod n
1
)
i
N
i
M
i
mod n, trong đó: N
i
= n/n
i
, M
i
= N
i
-1
mod n
i
[1 – tr26]
Ví dụ:
Cặp đồng dƣ: x 3 (mod 7 ) và x 7 (mod 13) có nghiệm duy nhất x 59 (mod 91)
Tính chất:
Nếu gcd(n
1,
n
2
) = 1 thì cặp đồng dƣ x a (mod n
1
) và x a (mod n
2
) có
*
.
Bậc của a, ký hiệu là ord(a) là số nguyên dƣơng t nhỏ nhất sao
cho a
t
1 (mod n). [1 – tr27]
2/. Các tính chất trong Z
n
*
Cho n ≥ 2 là số nguyên. [1 – tr27, tr28]
o (Định lý Euler) Nếu a Z
n
*
thì a
Φ(n)
1 (mod n).
o Nếu n là tích của các số nguyên tố phân biệt và nếu r s (mod Φ(n))
thì a
r
a
s
(mod n) với mọi số nguyên a.
Cho p là số nguyên tố. [1 – tr28]
o (Định lý Fermat) Nếu gcd(a, p) = 1 thì a
p-1
1 (mod p).
o Nếu r s (mod p – 1) thì a
r
. [1 – tr28]
Chú ý: Vì định nghĩa 0 Z
n
*
nên 0 Q
n
và 0
___
Q
n
2/. Ví dụ
Cho n = 21. Khi đó: Q
21
= {1, 4, 16} và
___
Q
21
= {2, 5, 8, 10, 11, 13, 17, 19, 20}. 1.1.6. Căn bậc modulo
1/. Định nghĩa
Cho a Q
n
. Nếu a Z
n
*
thoả mãn x
2
Căn bậc 2 của 121 modulo 315 là 11, 74, 101, 151, 164, 214, 241 và 304. 8
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.1.7. Các thuật toán trong Z
n
Cho n là số nguyên dƣơng, các phần tử trong Z
n
sẽ đƣợc thể hiện bởi các số
nguyên {0, 1, 2,…, n–1}. Ta thấy rằng nếu a, b Z
n
thì:
( ) mod
a b nÕu a b n
a b n
a b n nÕu a b n
Vì vậy, phép cộng modulo (và phép trừ modulo) có thể đƣợc thực hiện mà
không cần thực hiện các phép chia. Phép nhân modulo của a và b có thể đƣợc thực
hiện bằng phép nhân thông thƣờng a với b nhƣ các số nguyên bình thƣờng, sau đó
lấy phần dƣ của kết quả sau khi chia cho n. Phép tính nghịch đảo trong Z
n
= 1;
Khi b > 0 thực hiện:
q = [a / b]; r = a – qb; x
= x
2
– qx
1
; y = y
2
– qy
1
; a = b; r = b; x
2
= x
1
; x
1
= x; y
2
= y
1
; y
1
= y;
d = a; x
mod n
b
= 1; Nếu k == 0 return (b);
A
= a; Nếu k
0
== 1 thì đặt b
= a;
For i = 1 to t do
A
= A
2
mod n;
Nếu k
i
== 1 thì b
= A * b mod n;
Return (b);
Ví dụ: (Tính số mũ modulo)
i
0
1
2
3
1
1
625
625
67
67
1059
1059
1059
1013
Bảng 1.1: Mô tả các bƣớc tính 5
596
mod 1234
Độ phức tạp theo bit của các phép toán cơ bản trong Z
n
nhƣ sau:
Phép toán
Độ phức tạp về bit
Cộng modulo (a + b) mod n
O(lg n)
Trừ modulo (a – b) mod n
O(lg n)
Nhân modulo (a b) mod n
O((lg n)
2
)
Nghịch đảo theo modulo a
-1
nÕu a Q
p
nÕu a Q
2/. Tính chất của ký hiệu Legendre
Cho số nguyên tố lẻ p; a, b Z. Ký hiệu Legendre có tính chất sau: [1 – tr29, tr30]
(
p
a
) a
(p-1)/2
(mod p). Trƣờng hợp đặc biệt: (
p
1
) = 1 và (
p
1
) = (–1)
(p-1)/ 2
Bởi vậy nên: –1 Q
p
8/)1(
2
)1()
2
(
p
p
(
p
2
) = 1 nếu p 1 hoặc 7 (mod 8)
và (
p
2
) = –1 nếu p 3 hoặc 5 (mod 8)
Nếu q là số nguyên tố lẻ khác p thì: (
q
p
) = (
p
q
) (–1)
(p-1)(q-1) / 4
.
Nói cách khác: (
q
p
) = (
12
12
( ) ( ) ( ) ( )
k
e e e
k
a a a a
n p p p
[1 – tr29]
Rõ ràng, nếu n là số nguyên tố thì ký hiệu Jacobi là ký hiệu Legendre.
4/. Tính chất của ký hiệu Jacobi
Cho m ≥ 3, n ≥ 3 là số nguyên lẻ và a, b Z. Ký hiệu Jacobi có các tính chất sau:
(
n
a
) = 0, 1 hoặc –1, và (
n
a
) = 0 khi và chỉ khi gcd(a, n) 1.
(
n
ab
) = (
n
a
)(
n
b
) = 1.
(
n
1
) = –(1)
(n-1)/2
. Vì vậy (
n
1
) = 1 nếu n 1 (mod 4)
và (
n
1
) = –1 nếu n 3 (mod 4).
8/)1(
2
)1()
2
(
n
n
. Vì vậy, (
n
2
) = 1 nếu p 1 hoặc 7 (mod 8)
và (
n
1
với a
1
lẻ thì
4/)1)(1(
1
11
1
)1)(
mod
()
2
())(
2
()(
na
e
e
a
an
nn
a
nn
a
Từ đó có thuật toán tính (
n
a
== 1 thì return (s); Ngƣợc lại thì return (s . JACOBI(a
1
, n
1
));
Thuật toán trên chạy trong thời gian O((lg n)
2
) phép tính bit.
6/. Ví dụ (Tính ký hiệu Jacobi)
Cho a = 158 và và n = 235. Ký hiệu Jacobi (
235
158
) đƣợc tính nhƣ sau:
(
235
158
) = (
235
2
)(
235
79
) = (–1) (
79
235
)(–1)
78. 234 / 4
= (
79
Thuật toán mã hoá/ giải mã: là thuật toán dùng để chuyển thông tin thành dữ
liệu mã hoá hoặc ngƣợc lại.
Khoá: là thông tin mà thuật toán mã/ giải mã sử dụng để mã/ giải mã thông tin.
Mỗi khi một thông tin đã đƣợc mã hoá thì chỉ có những ngƣời có khoá thích hợp
mới có thể giải mã. Nếu không thì dù dùng cùng một thuật toán giải mã nhƣng cũng
không thể phục hồi lại thông tin ban đầu. Đây là đặc điểm quan trọng của khoá: mã
hoá chỉ phụ thuộc vào khoá mà không phụ thuộc vào thuật toán mã/ giải mã. Điều
này giúp cho một thuật toán mã/ giải mã có thể đƣợc sử dụng rộng rãi.
Với hình thức khá phổ biến hiện nay là truyền tin qua thƣ điện tử và không sử
dụng các công cụ mã hoá, bảo mật cũng nhƣ chữ ký điện tử thì các tình huống sau
có thể xảy ra:
Không chỉ nguời nhận mà ngƣời khác cũng có thể đọc đƣợc thông tin.
Thông tin mà ta nhận đƣợc có thể không phải là của ngƣời gửi đúng đắn.
Thông tin nhận đƣợc bị ngƣời thứ ba sửa đổi.
Bị nghe trộm: thông tin đƣợc truyền đi trên đƣờng truyền có thể bị ai đó “xâm
nhập” vào lấy ra, tuy nhiên vẫn đến đƣợc ngƣời nhận mà không bị thay đổi.
14
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Bị thay đổi: thông tin bị chặn lại ở một nơi nào đó trên đƣờng truyền và bị
thay đổi. Sau đó thông tin đã bị thay đổi này đƣợc truyền tới cho ngƣời nhận
nhƣ không có chuyện gì xảy ra.
Bị lấy cắp: thông tin bị lấy ra nhƣng hoàn toàn không đến đƣợc ngƣời nhận.
Khi đó thì khỏi nói đến thƣơng mại điện tử, chính phủ điện tử với nền quản
lý hành chính điện tử, Để giải quyết vấn đề này, thông tin trƣớc khi truyền đi sẽ
đƣợc mã hoá và khi tới ngƣời nhận, nó sẽ đƣợc giải mã trở lại.
Để đảm bảo rằng chỉ ngƣời cần nhận có thể đọc đƣợc thông tin mà ta gửi khi
biết rằng trên đƣờng đi, nội dung thông tin có thể bị theo dõi và đọc trộm, ngƣời ta
sử dụng các thuật toán đặc biệt để mã hoá thông tin. Trong trƣờng hợp này, trƣớc
khi thông tin đƣợc gửi đi, chúng sẽ đƣợc mã hoá lại và kết quả là ta nhận đƣợc một
1/. Ƣu điểm
Tốc độ mã/ giải mã nhanh. Đây là ƣu điểm nổi bật của mã đối xứng.
Sử dụng đơn giản: có thể dùng một khoá cho cả 2 bƣớc mã và giải mã.
2/. Nhƣợc điểm:
Đòi hỏi khoá phải đƣợc 2 bên gửi/ nhận trao tận tay nhau vì không thể truyền
khoá này trên đƣờng truyền mà không đƣợc bảo vệ. Điều này làm cho việc sử
dụng khoá trở nên không thực tế.
Không an toàn: càng nhiều ngƣời biết khoá thì độ rủi ro càng cao.
Trong trƣờng hợp khoá mã hoá thay đổi, cần thay đổi đồng thời ở cả ngƣời gửi
và ngƣời nhận, khi đó rất khó có thể đảm bảo đƣợc là chính bản thân khoá
không bị đánh cắp trên đƣờng đi.
Không cho phép ta tạo ra chữ ký điện tử.
Bản rõ
Mã hóa
Giải mã
Bản rõ
Khóa
Khóa
Bản mã
16
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3/. Một số thuật toán mã hoá khóa đối xứng
DES: 56 bit, không an toàn. Có thể dễ dàng bị bẻ khoá trong khoảng vài phút.
Triple DES, DESX, GDES, RDES: mở rộng độ dài của khoá ở mã DES lên tới
168 bit.
Bản rõ
Khóa mã
Bản mã
Khóa giải
17
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
của khoá công khai và nội dung của thông tin đã bị mã hoá vẫn không thể giải mã
đƣợc thông tin. Lý do là tính ngƣợc khoá bí mật từ khoá công khai hoặc là rất khó
khăn, nếu không nói là không thể. Điều này đạt đƣợc trên nguyên tắc sử dụng các
hàm một chiều trong toán học khi tính hàm y = f(x) là đơn giản nhƣng ngƣợc lại
việc tính giá trị y khi đã biết x là rất khó khăn.
2/. Nhƣợc điểm
Tốc độ mã hoá chậm: tốc độ mã hoá nhanh nhất của loại mã bất đối xứng
vẫn chậm hơn nhiều lần so với mã đối xứng. Do đó ngƣời ta thƣờng kết hợp 2 loại
mã hoá để nâng cao tốc độ mã hoá.
3/. Một số thuật toán mã hoá bất đối xứng
RSA: Loại mã này đƣợc dùng nhiều nhất cho web và chƣơng trình email. Độ
dài khoá thông thƣờng là từ 512 đến 1024 bit.
ElGamal: 512 đến 1024 bit.