đồ án : ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT TRONG MẠNG NGANG HÀNG - Pdf 13

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA VIỄN THÔNG 1
***
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
Đề tài:
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT
TRONG MẠNG NGANG HÀNG
Sinh viên thực hiện: Nguyễn Thế Tùng
Hà Nội, 11-2008 N
G
U
Y

N

T
H


G
I
Á

H
I

U

N
Ă
N
G

M

T

S


G
I
A
O

T
H

C


D
0
4
V
T
1
HỌC VIỆN CÔNG NGHỆ
BƯU CHÍNH VIỄN THÔNG
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc
KHOA VIỄN THÔNG 1
***
***
ĐỀ TÀI ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

NGANG HÀNG
Nội dung đồ án:
Đồ án nghiên cứu cơ chế hoạt động của một số giao thức DHT trong mạng
ngang hàng có cấu trúc. Từ đó sử dụng phần mềm mô phỏng P2PSim để phân tích,
đánh giá hiệu năng hoạt động của các DHT. Nội dung của đồ án được chia thành bốn
phần chính như sau:
 Lý thuyết chung về mạng ngang hàng
 Lý thuyết về Bảng băm phân tán DHT
 Phương pháp nghiên cứu mạng ngang hàng
 Đánh giá hiệu năng một số DHT
Ngày giao đồ án:……/ /2008
Ngày nộp đồ án: ……/11/2008
Ngày …. tháng 11 năm 2008
Giáo viên hướng dẫn
TS. Lê Nhật Thăng
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….

Thuật ngữ viết tắt 4
Thuật ngữ viết tắt Đồ án tốt nghiệp 4
Lời nói đầu 5
Lời nói đầu Đồ án tốt nghiệp 5
Chương 1: Lý thuyết chung về mạng ngang hàng 6
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp 8
Chương 2: Lý thuyết về Bảng băm phân tán DHT 24
Chương 2: Lý thuyết chung về bảng băm phân tán DHT Đồ án tốt nghiệp 24
Chương 3: Phương pháp nghiên cứu mạng ngang hàng 44
Chương 3: Phương pháp nghiên cứu mạng ngang hàng Đồ án tốt nghiệp 44
Chương 4: Đánh giá hiệu năng một số DHT 56
Chương 4: Đánh giá hiệu năng một số DHT Đồ án tốt nghiệp 56
Kết luận 75
Kết luận Đồ án tốt nghiệp 75
Tài liệu tham khảo 76
Tài liệu tham khảo Đồ án tốt nghiệp 76
Nguyễn Thế Tùng – Đ04VT1
1
Danh mục hình vẽ Đồ án tốt nghiệp
Danh mục hình vẽ
Hình 1-1: Hệ thống mạng 6
Hình 1-2: Hệ thống mạng chủ - khách 7
Hình 1-3: Mạng ngang hàng 8
Hình 1-4: Mạng ngang hàng hoàn toàn 11
Hình 1-5: Mạng lai ghép 12
Hình 1-6: Mạng lai ghép với chỉ số hoá tập trung 13
Hình 1-7: Mạng lai ghép với chỉ số hoá phân tán 13
Hình 1-8: Cơ chế danh mục tập trung 14
Hình 1-9: Cơ chế yêu cầu liên tục 15
Hình 1-10: Cơ chế bảng băm phân tán 15

Hình 4-3: Lưu đồ xác định ngưỡng churn rate 62
Hình 4-4: Ngưỡng churn rate Chord hoạt động tốt 62
Hình 4-5: Ngưỡng churn rate Kademlia hoạt động tốt 63
Hình 4-6: Ngưỡng churn rate Kelips hoạt động tốt 63
Hình 4-7: Ngưỡng churn rate Tapestry hoạt động tốt 64
Hình 4-8: Hiệu năng Chord với churn rate rất cao 65
Hình 4-9: Hiệu năng Kademlia với churn rate rất cao 65
Hình 4-10: Hiệu năng Kelips với churn rate rất cao 66
Hình 4-11: Hiệu năng Tapestry với churn rate rất cao 66
Hình 4-12: So sánh các DHT với churn rate 60s 67
Hình 4-13: So sánh các DHT với churn rate 300s 67
Hình 4-14: Ảnh hưởng của base đối với Chord 68
Hình 4-15: Ảnh hưởng của pnstimer đối với Chord 68
Hình 4-16: Ảnh hưởng của alpha đối với Kademlia 69
Hình 4-17: Ảnh hưởng của stabilize_timer đối với Kademlia 69
Hình 4-18: Ảnh hưởng của round_interval đối với Kelips 70
Hình 4-19: Ảnh hưởng của n_contacts đối với Kelips 70
Hình 4-20: Ảnh hưởng của stabtimer đối với Tapestry 71
Hình 4-21: Ảnh hưởng của base đối với Tapestry 71
Hình 4-22: Tính khả mở của Chord 72
Hình 4-23: Tính khả mở của Kademlia 72
Hình 4-24: Tính khả mở của Kelips 73
Hình 4-25: Tính khả mở của Tapestry 73
Nguyễn Thế Tùng – Đ04VT1
3
Thuật ngữ viết tắt Đồ án tốt
nghiệp
Thuật ngữ viết tắt
Từ viết tắt Tiếng Anh Tiếng Việt
CLI Command Line Interface Giao diện dòng lệnh

VoD Video on Demand Video theo yêu cầu
Nguyễn Thế Tùng – Đ04VT1
4
Lời nói đầu Đồ án tốt
nghiệp
Lời nói đầu
Khoảng mười năm trở lại đây, thế giới đã chứng kiến sự bùng nổ của Internet
băng thông rộng, cùng với nó là sự phát triển mạnh mẽ của các ứng dụng peer-to-
peer. Với nhiều ưu điểm hứa hẹn như tính hiệu quả, linh hoạt và khả năng mở rộng
cao, các mạng peer-to-peer đã và đang thu hút được nhiều sự quan tâm từ cộng đồng
nghiên cứu. Mạng peer-to-peer đã phát triển qua nhiều thế hệ, thế hệ hiện nay là
mạng có cấu trúc dựa trên khả năng lưu trữ và tìm kiếm dữ liệu hiệu quả theo cơ chế
Bảng băm phân tán (DHT).
Các DHT được thiết kế để hoạt động trong môi trường tương đối ổn định với
các peer là máy tính. Tuy nhiên vài năm gần đây, các thiết bị nối mạng ngày càng
phong phú và đa dạng, từ điện thoại, PDA, … cho đến tivi. Các thiết bị này kết nối và
rời khỏi mạng trong thời gian ngắn khiến cho độ ổn định của mạng rất thấp dẫn đến
hiệu năng của các DHT giảm sút rõ rệt. Phân tích, đánh giá hiệu năng của các DHT
trong môi trường mới là vấn đề đang rất được quan tâm hiện nay.
Nội dung của đồ án bao gồm bốn phần chính như sau:
Chương 1: Lý thuyết chung về mạng ngang hàng
Chương 2: Lý thuyết về Bảng băm phân tán DHT
Chương 3: Phương pháp nghiên cứu mạng ngang hàng
Chương 4: Đánh giá hiệu năng một số DHT
Em xin gửi lời cám ơn đến các thầy giáo cô giáo đã dạy dỗ em tận tình trong
suốt quá trình học tập tại Học Viện. Xin chân thành cám ơn TS. Nguyễn Chấn Hùng
và ThS. Ngô Hoàng Giang đã cung cấp những thông tin tài liệu qúy báu giúp đỡ em
trong thời gian vừa qua. Đặc biệt em vô cùng biết ơn thầy giáo TS. Lê Nhật Thăng đã
dành nhiều thời gian tận tình hướng dẫn, tạo điều kiện thuận lợi để em hoàn thành đồ
án này.

trong mạng được phân tán khắp nơi.
Hệ thống phân tán có thể được chia nhỏ hơn thành mô hình mạng chủ-khách và
mô hình ngang hàng. Trong hệ thống mạng chủ-khách có sự phân biệt giữa các máy
tính trong mạng, một số ít các máy gọi là máy chủ (server), đây là những máy có khả
năng tính toán rất mạnh, tốc độ xử lý nhanh. Tại những máy này có lưu trữ tài nguyên
mạng và các dịch vụ, nó đóng vai trò là người phục vụ cho các yêu cầu của máy tính
khác trong mạng về tài nguyên và dịch vụ. Phần lớn các máy còn lại gọi là máy khách
(client), nó chỉ đưa ra các yêu cầu và sử dụng tài nguyên trên mạng mà không thể chia
sẻ các tài nguyên hay dịch vụ của chính nó. Trong hệ thống chủ-khách các máy khách
khi vào hệ thống được nối với máy chủ, nhận quyền truy nhập và tài nguyên mạng từ
máy chủ. Các máy khách được sắp xếp tổ chức theo một quy luật nhất định và đặt
dưới sự quản lý của máy chủ. Mô hình hệ thống chủ-khách được minh họa như Hình
1-2.
Hình 1-2: Hệ thống mạng chủ - khách
Trong hệ thống chủ-khách có thể phân loại ra thành hệ thống phẳng (flat) và hệ
thống có trật tự phân cấp (hierachical). Việc phân loại này dựa trên cấu trúc của hệ
thống. Trong hệ thống phẳng tất cả các máy khách chỉ kết nối với duy nhất một máy
chủ phục vụ, còn trong hệ thống có phân cấp thì các máy được phân theo thứ bậc về
vai trò trong mạng làm cải thiện tính linh hoạt của hệ thống.
Nguyễn Thế Tùng – Đ04VT1
7
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Ưu điểm chính của hệ thống này là sự đơn giản của nó. Vì tất cả dữ liệu đều
được tập trung tại một vị trí nên việc quản lý hệ thống là khá dễ dàng và cũng tương
đối dễ bảo mật. Tuy nhiên, trở ngại của hệ thống này cũng chính bởi mọi thông tin đều
tập trung tại máy chủ. Do đó, nó là một điểm có thể gây lỗi trầm trọng cho hệ thống vì
nếu gặp trục trặc, toàn bộ các ứng dụng client nối với server cũng sẽ gặp trục trặc theo.
Server cũng là nơi làm đình trệ hiệu năng của hệ thống. Mặc dù kiến trúc
Client/Server được chấp nhận rộng rãi tại các Web-server hay các database-server
nhưng nhược điểm về tính mở rộng và tỉ lệ gặp lỗi làm cho hệ thống này không thích

phải có các kỹ sư của công ty; không cần phải thiết lập hình thức tổ chức trung tâm; và
không phải lo đến những vị khách lạ truy nhập vào mạng công ty.
Mặc dù mọi sự chú ý đều tập trung vào vấn đề cộng tác, các hệ thống P2P cho
phép các ứng dụng phần mềm tương tác với nhau đem lại nhiều hứa hẹn nhất cho các
ứng dụng kết hợp các dữ liệu phân tán cho thương mại điện tử, thiêt kế sản phẩm hoặc
quản lý tri thức. Các chương trình đó dùng P2P như một phương thức gửi dữ liệu vào
và ra từ trình ứng dụng này tới trình ứng dụng khác hoặc liên kết một số lượng vô hạn
các máy tính thành một cơ sở dữ liệu khổng lồ. Công nghệ tương tác phần mềm cho
phép các công ty chia nhỏ các vấn đề phức tạp cho dễ quản lý hơn. Các hệ thống cho
phép đối chiếu dữ liệu và đảm bảo rằng chúng đang được điều khiển bởi chính những
người tạo ra chúng, đảm bảo rằng hoạt động chính xác và kịp thời rất lý tưởng cho các
ứng dụng trực tuyến và kinh doanh chứng khoán.
Một loạt các hãng mới thành lập đang tạo ra những chương trình tận dụng tài
nguyên triển khai khả nǎng của P2P để lưu trữ các file, phân phối nội dung và chia sẻ
sức mạnh xử lý của các máy khác. Mục đích ở đây một phần là cắt giảm giá thành
phần cứng chẳng hạn như thiết bị lưu trữ, server và các thiết bị khác, nhưng cũng giúp
cho việc quản lý giao thông trên mạng. Mặc dù có tiềm nǎng dịch vụ lớn, nhưng đây là
một vấn đề khó khǎn nhất của P2P. Có quá nhiều vấn đề liên quan đến an toàn bảo
Nguyễn Thế Tùng – Đ04VT1
9
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
mật và sự phức tạp - không đề cập đến giá của các thiết bị lưu trữ và các server giảm
xuống - khiến cho các dịch vụ P2P trở nên không thiết thực.
Cuối cùng, công nghệ P2P có thể áp dụng cho các dịch vụ tính toán phân tán có
khả nǎng đạt được siêu xử lý cho các công ty cần khả nǎng xử lý lớn nhưng không
muốn bỏ hàng triệu đôla cho nó. Công nghệ này đã chia việc xử lý lớn ra thành những
xử lý nhỏ có thể phân tán giữa các máy tính trong một mạng. Mỗi một PC đồng thời
xử lý các dữ liệu và trả về kết quả cho máy tính trung tâm ráp nối các phần này lại. Ví
dụ, tiến trình này có thể được sử dụng để chia ra từng ảnh nhỏ riêng biệt để tạo hình
ảnh động cho những máy PC khác nhau thực hiện đồng thời và sau đó kết hợp những

tin học cho rằng trong thương mại, P2P chỉ thích hợp cho những ứng dụng có trao đổi
thông tin trực tiếp. Như vậy, server sẽ tiếp tục duy trì vị trí của mình trong việc quản
lý nhân sự và chi tiêu, kế hoạch kinh doanh và nhiều ứng dụng khác. Tuy nhiên, trong
tương lai, server sẽ cung cấp các dịch vụ cao cấp hơn thay vì những việc lặt vặt đơn
giản như lưu trữ và phân phát các tệp. P2P là một kiểu kiến trúc máy tính mới có nhiều
hứa hẹn. Tuy vậy để có thể có các ứng dụng tin cậy như thực tế đòi hỏi, không ít công
sức và thời gian sẽ phải bỏ ra.
1.3 Phân loại mạng ngang hàng
1.3.1 Phân loại theo mức độ phân quyền
Phân quyền là một trong những khái niệm chính của hệ thống mạng ngang
hàng. Điều này bao gồm phân phối tài nguyên lưu trữ, sự xử lý, thông tin chia sẻ cũng
như thông tin điều khiển. Dựa trên cơ sở mức độ phân quyền và cách thức trao đổi, thu
nhận tài nguyên của các máy tính trong mạng ngang hàng người ta chia mạng ngang
hàng ra làm hai loại kiến trúc chính:
a, Mạng P2P thuần nhất
Hình 1-4: Mạng ngang hàng hoàn toàn
Trong hệ thống này, tất cả các máy đều được nối với nhau, đây là mô hình thể
hiện chính xác nhất bản chất của mạng ngang hàng. Trong mạng ngang hàng hoàn
Nguyễn Thế Tùng – Đ04VT1
11
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
toàn không có máy chủ trung tâm quản lý mạng, mọi máy tính trong mạng có vai trò
vừa là máy chủ vừa là máy khách. Trong mạng không có các máy định tuyến hay
trung tâm định tuyến, các máy trong mạng tự định tuyến cho chính nó. Trong hệ thống
như vậy tất cả các máy là cân bằng về chức năng, các máy là các node và được gọi là
“serv-ent”.
Ưu điểm của loại mạng này là khả năng mở rộng nhanh, khả năng chịu lỗi của
hệ thống lớn, các máy trong mạng có tính tự chủ cao. Khi trong mạng có một vài node
lỗi thì không gây ra lỗi toàn mạng và dễ dàng khắc phục. Các node có vai trò lớn hơn
đối với dữ liệu và tài nguyên của nó. Nhược điểm chính của mạng là tốc độ phát hiện

Nguyễn Thế Tùng – Đ04VT1
13
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
giảm tải đáng kể cho server tránh lỗi cho toàn hệ thống nhưng phát hiện thông tin
chậm hơn. Ví dụ: mạng Kazaa, Morpheus.
1.3.2 Phân loại theo cơ chế tìm kiếm
Cơ chế định vị thông tin trong hệ thống là đặc điểm căn bản trong hệ thống P2P.
Cơ chế tìm kiếm trong mạng ngang hàng được phát triển từ thế hệ thứ nhất với cấu
trúc danh mục tập trung tới thế hệ thứ hai với cơ chế yêu cầu liên tục và thế hệ thứ ba
dựa vào bảng băm phân tán.
a, Cơ chế danh mục tập trung
Hình 1-8: Cơ chế danh mục tập trung
Cơ chế này được sử dụng trong mạng lai ghép, các máy khách kết nối tới máy
chủ chứa trung tâm thư mục, là nơi lưu trữ tất cả các thông tin về vị trí và cách sử
dụng tài nguyên. Dựa trên yêu cầu từ máy khách trung tâm chỉ số sẽ đưa yêu cầu tới
máy khách tốt nhất mà có thư mục phù hợp với yêu cầu. Máy khách tốt nhất có thể là
rẻ nhất, nhanh nhất, gần nhất, hoặc sẵn sàng nhất, phụ thuộc vào người sử dụng cần.
Sau đó dữ liệu sẽ được trực tiếp trao đổi giữa hai máy khách. Mạng Napster sử dụng
phương pháp này, một máy chủ trung tâm sẽ giữ gìn chỉ số của dữ liệu với các trường
tiêu đề của tất cả các file trên mạng, một bảng các thông tin đăng kí kết nối của người
dùng như địa chỉ IP, tốc độ kết nối…, một bảng danh sách các file mà người sử dụng
giữ và chia sẻ trong mạng. Khi bắt đầu, máy khách sẽ tiếp xúc với máy chủ trung tâm
và đưa ra một danh sách với các file mà nó giữ. Khi máy chủ thu được một yêu cầu từ
người dùng. Nó sẽ tìm kiếm cho chỉ số phù hợp file cần tìm, trả lại danh sách những
người dùng đang giữ file phù hợp. Người dùng sẽ thiết lập một kết nối trực tiếp tới
máy đang giữ file và lấy nó về.
Mô hình này có nhược điểm là khả năng mở rộng không cao, dễ bị lỗi toàn hệ
thống.
Nguyễn Thế Tùng – Đ04VT1
14

quả với mạng có số peer lớn. Tuy vậy nó vẫn tồn tại các nhược điểm đó là khó cài đặt
tính năng tìm kiếm do phải biết trước ID của file trước khi gửi yêu cầu. Băm tên file
hoặc nội dung khác nhau tạo ra ID khác dẫn đến không tìm thấy file. Các node khi
chia vào các nhóm khác nhau không có sự liên hệ dẫn đến vấn đề ‘’islanding’’(cô lập).
1.3.3 Phân loại theo cấu trúc
Cấu trúc mạng ngang hàng bao gồm tất cả các nút mạng đại diện cho các máy
tham gia và các liên kết giữa các nút mạng này. Một liên kết tồn tại giữa hai nút mạng
khi một nút mạng biết vị trí của nút mạng kia. Dựa vào cấu trúc liên kết giữa các nút
mạng ta có thể phân loại mạng ngang hàng thành 2 loại: có cấu trúc hay không cấu
trúc.
Một mạng ngang hàng không cấu trúc khi các liên kết giữa các nút mạng trong
mạng phủ được thiết lập ngẫu nhiên (tức là không theo qui luật nào). Những mạng như
thế này dễ dàng được xây dựng vì một máy mới khi muốn tham gia mạng có thể lấy
các liên kết có sẵn của một máy khác đang ở trong mạng và sau đó dần dần tự bản
thân nó sẽ thêm vào các liên kết mới của riêng mình. Khi một máy muốn tìm một dữ
liệu trong mạng ngang hàng không cấu trúc, yêu cầu tìm kiếm sẽ được truyền trên cả
mạng để tìm ra càng nhiều máy chia sẻ càng tốt. Hệ thống này thể hiện rõ nhược điểm:
tỉ lệ tìm kiếm thành công thấp. Đối với tìm kiếm các dữ liệu phổ biến được chia sẻ trên
nhiều máy, tỉ lệ thành công là khá cao, ngược lại, nếu dữ liệu chỉ được chia sẻ trên một
vài máy thì xác suất tìm thấy là khá nhỏ. Tính chất này là hiển nhiên vì trong mạng
ngang hàng không cấu trúc, không có bất kì mối tương quan nào giữa một máy và dữ
liệu nó quản lý trong mạng, do đó yêu cầu tìm kiếm được chuyển một cách ngẫu nhiên
đến một số máy trong mạng. Số lượng máy trong mạng càng lớn thì khả năng tìm thấy
Nguyễn Thế Tùng – Đ04VT1
16
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
thông tin càng nhỏ. Một nhược điểm khác của hệ thống này là do không có định
hướng, một yêu cầu tìm kiếm thường được chuyển cho một số lượng lớn máy trong
mạng làm tiêu tốn một lượng lớn băng thông của mạng, dẫn đến hiệu quả tìm kiếm
chung của mạng thấp.

Mục đích của ứng dụng hợp tác trong mạng ngang hàng là cho phép cộng tác ở
mức ứng dụng giữa các người dùng ví dụ như chat, instant messaging, online game
đến các ứng dụng chia sẻ có thể sử dụng trong kinh doanh, giáo dục …
1.4.4 Lớp nền
P2P platform cung cấp hạ tầng cho các ứng dụng phân tán sử dụng cơ chế P2P.
Các phần tử P2P sử dụng ngữ cảnh để phát hiện, kết nối, bảo mật, tập hợp tài
nguyên…Ví dụ JXTA là một P2P platform cung cấp một nền cơ bản cho việc lập trình
và xử lí trên mạng.
1.5 Các vấn đề đối với mạng ngang hàng
Hệ thống P2P có một số ưu điểm hơn so với hệ thống client-server truyền thống
như khả năng mở rộng, khả năng chịu lỗi, hiệu năng cao. Tuy nhiên còn nhiều vấn đề
mà các hệ thống P2P hiện nay đang phải giải quyết:
1.5.1 Tính bảo mật
Bảo mật cho hệ thống P2P khó khăn hơn các hệ thống khác, các node trong hệ
thống là động, phân tán khắp nơi, các node không chứng thực lẫn nhau. Các cơ chế
bảo mật truyền thống như tường lửa, xác thực… không thể bảo vệ hệ thống P2P ngược
lại có thể ngăn cản quá trình truyền thông trong hệ thống. Bởi vậy những khái niệm
bảo mật mới được đặt ra đối với hệ thống P2P.
1.5.2 Độ tin cậy
Một hệ thống đáng tin cậy là hệ thống có thể phục hồi khi lỗi xảy ra. Những
nhân tố cần phải quan tâm khi tính toán cho sự tin cậy là: nhân bản dữ liệu, phát hiện
node lỗi, phục hồi… đảm bảo cho thông tin định vị tránh lỗi đơn và khả năng sẵn sàng
nhiều đường dẫn tới dữ liệu. Nhân bản dữ liệu tăng sự tin cậy bằng việc tăng sự dư
thừa và định vị. Có hai chiến lược cho nhân bản: nhân bản nguyên gốc và nhân bản
đường dẫn. Trong nhân bản nguyên gốc, khi tìm kiếm thành công dữ liệu được lưu trữ
chỉ tại node yêu cầu. Trong nhân bản đường dẫn khi tìm kiếm thành công dữ liệu được
lưu trữ tại tất cả các node dọc theo đường dẫn từ node yêu cầu tới node cung cấp.
Nguyễn Thế Tùng – Đ04VT1
18
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp

của mạng Edonkey cài đặt trên máy khách kết nối vào mạng để chia sẻ tài nguyên.
Các máy chủ đóng vai trò như những hub truyền thông cho các khách hàng, cho phép
người sử dụng định vị tài liệu trong mạng. Bằng việc chạy phần mềm máy chủ
Edonkey trên một máy tính kết nối vào Internet, bất kỳ người sử dụng nào cũng có thể
kết nối tới máy chủ để vào mạng. Số máy chủ và địa chỉ của nó thường xuyên thay
đổi, chương trình chạy trên các máy khách sẽ thường xuyên cập nhật danh sách các
server.
Đặc tính của mạng Edonkey là các tài liệu được nhận dạng duy nhất bằng cách
sử dụng thuật toán băm MD4, nó là hàm duy nhất của nội dung tài liệu. Điều này có
nghĩa là khi tên file giống nhau nhưng nội dung khác nhau thì số nhận dạng sẽ khác
nhau. Hơn nữa những tài liệu mà có kích thước lớn hơn 9.28MB sẽ được chia ra thành
các khối và việc kiểm tra của thuật toán MD4 sẽ tính toán cho các khối đó. Bằng việc
tính giá trị theo MD4 cho các khối, khối bị lỗi của một file lớn sẽ được nhận dạng và
được tải về lại sau đó chứ không yêu cầu phải tải lại toàn bộ file. Hơn nữa những khối
không bị lỗi sau khi được tải xuống có thể lập tức được chia sẻ thậm chí trước khi
phần còn lại của tài liệu được tải xuống, tăng tốc độ phân phối của những tài liệu lớn
khắp mạng. Để tính giá trị tổng của một tài liệu, MD4 cộng tất cả các giá trị của các
phần ra được kết quả băm của file, đây là giá trị ID gắn với file.
Trong mạng Edonkey các máy chủ phục vụ xuất hiện để kiểm duyệt những nội
dung chia sẻ và thông tin về các file bằng cách kiểm tra kiểu của file. Các máy này là
Nguyễn Thế Tùng – Đ04VT1
20


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status