tóm tắt luận văn thạc sỹ chuyên ngành hệ thống thông tin nghiên cứu các hệ thống file phân tán và ứng dụng - Pdf 13



HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
LẠI XUÂN PHONG NGHIÊN CỨU CÁC HỆ THỐNG FILE PHÂN TÁN
VÀ ỨNG DỤNG Chuyên ngành: Hệ thống thông tin
Mã số: 60.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - NĂM 2014 Luận văn được hoàn thành tại:

1

MỞ ĐẦU
1. Lý do chọn đề tài
Cùng với sự phát triển của các mạng máy tính, việc quản lý, lưu trữ và xử lý
thông tin ngày nay không chỉ được thực hiện trong từng máy tính đơn lẻ như
trước. Các hệ thống thông tin cần được xây dựng từ các máy tính kết nối với
nhau qua mạng tốc độ cao. Hệ thống file phân tán (Distributed File System) là hệ
thống quản lý và lưu trữ các file được xây dựng trên cơ sở mạng máy tính, trong
đó các file được quản lý và lưu trữ trên nhiều máy tính trên mạng. Hệ thống file
phân tán có những ưu điểm vượt trội so với hệ thống file tập trung (hệ thống file
trên 1 máy tính), như dung lượng lưu trữ lớn, độ tin cậy cao, khả năng chịu lỗi
cao, hỗ trợ tốc độ truy cập cao cho nhiều người dùng đồng thời. Tuy có nhiều ưu
điểm vượt trội, nhưng do chi phí lắp đặt và vận hành còn tương đối cao, nên các
thống file phân tán chưa được sử dụng rộng rãi trong các doanh nghiệp và tổ
chức có quy mô vừa và nhỏ.
Trong điều kiện hạ tầng công nghệ thông tin còn yếu ở Việt Nam, hầu hết
các doanh nghiệp và tổ chức có quy mô vừa và nhỏ đều sử dụng một hoặc một số
máy chủ riêng rẽ để quản lý và lưu trữ thông tin. Phương pháp này có ưu điểm là
chi phí thấp, nhưng không đảm bảo dung lượng, tính tin cậy và tốc độ truy nhập
cho nhiều người dùng. Do vậy, việc nghiên cứu sâu về hệ thống file phân tán và
ứng dụng hiệu quả vào các doanh nghiệp và tổ chức có quy mô vừa và nhỏ là
yêu cầu thực tế cấp thiết. Đây cũng là lý do tôi chọn đề tài này.
2. Mục đích nghiên cứu :
- Nghiên cứu tổng quan về hệ thống file phân tán, các kỹ thuật xây dựng hệ
thống file phân tán.
- Xây dựng mô hình ứng dụng và thử nghiệm hệ thống file phân tán cho

hỗ trợ chia sẻ files và các tài nguyên trên mạng.
1.2 Lịch sử phát triển
Một số mốc phát triển của các hệ thống file phân tán:
- 1980s: Chia sẻ file dùng đĩa mềm (copy – vận chuyển – copy).
-1980s: Chia sẻ file dùng giao thức FTP, vẫn cần 2 lần copy và user phải
biết địa chỉ vật lý của ftp server.
- SPRITE Network OS: được phát triển vào giữa những năm 1980 tại ĐH
University of California at Berkerly, Mỹ.
- Năm 1983: Andrew File System (AFS) được phát triển tại ĐH Carnegie
Mellon với sự hỗ trợ của hãng IBM, Mỹ.
- Năm 1985: Sun NFS được hãng Sun Microsystems phát triển.
-Đầu năm 1990s: Hệ thống file CODE được phát triển. Đây là bản kế tiếp
của AFS.
- ZEBRA: Được phát triển vào đầu những năm 1990 tại ĐH University of
California at Berkerly, Mỹ.
- HARP: Được phát triển vào đầu những năm 1990 tại ĐH MIT, Mỹ.
4

- Lustre: Là một DFS mã mở, có khả năng kết hợp hàng chục ngàn nút và
cung cấp dung lượng lưu trữ đến petabytes. Phiên bản 1.80 được phát hành vào
tháng 5 năm 2009.
1.3 Các yêu cầu đối với hệ thống file phân tán
Các yêu cầu chính đối với hệ thống file phân tán bao gồm: tính trong suốt,
hiệu năng, khả năng chịu lỗi và khả năng mở rộng.
1.4 Các kỹ thuật đặt tên file trong hệ thống file phân tán
Các kỹ thuật thực hiện việc đặt tên file trong hệ thống file phân tán bao
gồm: Dịch tên đường dẫn, Tên nhận dạng có cấu trúc, Thông tin gợi ý hint và
Các cơ chế mount.
1.4.1 Dịch tên đường dẫn (Pathname translation)
Dịch tên đường dẫn là ánh xạ từ trên file sang tên nhận dạng mức thấp và

6

Chương 2 - MỘT SỐ HỆ THỐNG FILE PHÂN TÁN
2.1 Hệ thống file phân tán NFS (Network File System)
Hệ thống file mạng phát triển bởi hãng Sun Microsystem (Mỹ) - thường
được gọi tắt là NFS. NFS ban đầu được phát triển chủ yếu dành cho các máy
trạm UNIX, tuy nhiên sau đó nó cũng có thể chạy tốt trên các hệ điều hành khác
2.1.1 Tổng quan về NFS
Trong mô hình dịch vụ file từ xa (Remote file service), các client truy cập
một cách trong suốt đến hệ thống file được quản lý bởi một server ở xa. Vì thế,
thông thường các client không biết vị trí lưu trữ thực sự của các file. Thay vào
đó, chúng được cung cấp một giao diện truy nhập đến hệ thống file, tương tự như
giao diện của các hệ thống file cục bộ thông thường. Trong trường hợp riêng,
client chỉ được cung cấpmột giao diện chứa nhiều các thao tác file khác nhau,
server chỉ có nhiệm vụ thực thi các thao tác file đó.
Mô hình hệ thống file được đưa ra bởi NFS cũng giống như mô hình được
đưa ra bởi hệ thống dựa trên UNIX. Các file sẽ được xem như dãy tuần tự các
byte. Chúng được tổ chức phân cấp trong một đồ thị định danh, trong đó các nút

server và kết quả là server sẽ phải thực hiện lại yêu cầu đó thêm một lần nữa.
2.1.6 An toàn – an ninh
Ý tưởng chính của NFS đó là một hệ thống file từ xa sẽ được hiện diện tại
client như thể nó là một phần trong hệ thống file cục bộ của client. Cũng chính vì
vậy mà vấn đề an toàn, an ninh trong NFS luôn được tập trung chính vào truyền
thông giữa client và server. Truyền thông an toàn có nghĩa là có một kênh an
toàn được thiết lập ở giữa server và client.
2.2 Hệ thống file phân tán GFS (Google File System)
8

2.2.1 Giới thiệu về GFS
Hệ thống file Google (Google File System - GFS)

được phát triển nhằm đáp
ứng nhu cầu xử lý thông tin ngày càng tăng của Google. GFS cũng hướng tới
những mục tiêu chính tương tựnhư những hệ thống file phân tán đã có, như hiệu
năng, tính mở rộng và tính sẵn sàng. Tuy nhiên, GFS được xây dựng dựa trên
một số giả định đầu vào xuất phát từ việc khảo sát khối lượng dữ liệu cần xử lý
của các ứng dụng và môi trường công nghệ hiện tại.
2.2.2 Kiến trúc của GFS
GFS bao gồm một master (máy chủ) đơn và nhiều chunkservers (bộ
chứa dữ liệu) và được truy cập bởi nhiều clients (máy khách). Mỗi một
chunkserver là một máy tính chạy Linux phổ thông điển hình thực hiện thao tác
của máy chủ ở cấp người dùng. Một chunkserver cũng có thể được sử dụng như
một máy khách với điều kiện đảm bảo hiệu năng.
Các tập tin được chia thành nhiều chunks có kích thước cố định. Mỗi
một chunk (đoạn dữ liệu) được xác định bằng một chunk handle 64 bit duy nhất
không thể biến đổi mà mang tính toàn cục, được gán bởi máy chủ (master) vào
thời điểm tạo chunk. Các chunkserver lưu trữ các chunk ở đĩa cục bộ như là các
file Linux đồng thời đọc hoặc ghi dữ liệu chunk được xác định bởi chunk handle

CIFS.
2.3.3 Lịch sử phát triển
Năm 1984, IBM phát triển một giao thức lập trình ứng dụng (API) cho phép
các trao đổi mạng cơ bản giữa các máy trong một mạng nhỏ.Tuy nhiên, API yêu
cầu một giao thức tầng giao vận để có thể gửi và nhận dữ liệu. Một năm sau đó,
IBM đã phát triển một giao thức tầng giao vận có thể đưa NetBIOS API vào đời
10

sống. API và giao thức giao vận được gộp vào một đối tượng thực thể và gọi là
NetBIOS Enhanced User Interface, hay là NetBEUI.
Vào thời gian đó, các giao thức giao vận khác đang được sử dụng phổ biến
và NetBIOS API đã nhanh chóng được triển khai sử dụng trên nhiều giao thức
giao vận như DECnet, IPX/SPX và TCP/IP. Đồng thời, API cũng đã trở nên khá
phổ biến.
Sau đó Microsoft và Intel đã lần đầu tiên giới thiệu giao thức chia sẻ file
SMB/CIFS, với tiêu đề là “Giao thức cốt lõi” (Core Protocol). Microsoft và Intel
chọn sử dụng NetBIOS API để giao chuyển các gói tin CIFS ở tầng trên. Kể từ
đó, CIFS sử dụng NetBIOS trên TCP đã trở thành cơ chế chia sẻ file trên mạng
chuẩn mực cho các hệ điều hành của Microsoft.
2.3.4 Sự thay đổi trong tương lai
Nhiều nhà cung cấp đang tìm kiếm cách thức để có thể hoàn toàn thực hiện
từng giai đoạn của NetBIOS và chạy CIFS trực tiếp trên TCP và UDP. Trong
CIFS1.0 đã cho rằng CIFS không phụ thuộc vào giao thức giao vận cụ thể nào và
có chỉ ra cách CIFS chạy trên TCP.
2.4 Hệ thống file phân tán Lustre
2.4.1Tổng quan về Lustre
Hệ thống file phân tán Lustre đem đến hiệu năng đáng kể và khả năng mở
rộng dựa trên các hệ thống file phân tán hiện có. Lustre tận dụng sức mạnh và
tính linh hoạt của hệ điều hành nguồn mở Linux để cung cấp một hệ thống file
tuân thủ POSIX thực sự hiện đại, đáp ứng các yêu cầu của các cụm (cluster) lớn

Hiện tại, hệ thống mạng máy tính và các thiết bị công nghệ thông tin của
Công ty Cổ phần Cung cấp Thiết bị Thăng Long phục vụ cho công tác quản lý và
hoạt động kinh doanh gồm có: 01 Server, 27 máy tính bàn dùng cho cán bộ nhân
12

viên các phòng, 10 máy tính xách tay cho ban giám đốc và các trưởng phòng
trong công ty; 01 modem đường truyền cáp quang 1Gbps; 4 Switch; 3 bộ phát
Wireless, hệ thống camera IP giám sát có 10 chiếc và các thiết bị khác.
3.1.2 Nhu cầu
Nhằm khắc phục các nhược điểm hiện tại trong cơ sở hạ tầng công nghệ
thông tin của Công ty Cổ phần Cung cấp Thiết bị Thăng Long, đòi hỏi phải xây
dựng một hệ thống quản lý và lưu trữ dữ liệu hiện đại có khả năng mở rộng,
dung lượng lưu trữ lớn, độ tin cậy cao, khả năng chịu lỗi cao và hỗ trợ tốc độ
truy cập cao cho nhiều người dùng đồng thời. Một hệ thống file phân tán (DFS)
có quy mô vừa là lựa chọn khả thi và phù hợp với quy mô của Công ty và nhu
cầu phát triển cho tương lai. Trong hệ thống file phân tán sẽ được xây dựng thì
máy chủ hiện có cũng như các máy chủ sẽ được trang bị bổ sung có nhu cầu về
quản lý, lưu trữ và xử lý thông tin sẽ được kết nối vào hệ thống.
3.1.2 Mô hình ứng dụng DFS cho doanh nghiệp vừa và nhỏ
Mô hình ứng dụng DFS cho doanh nghiệp vừa và nhỏ có thể được xây
dựng theo mô hình tham khảo một DFS cỡ nhỏ dựa trên MS Windows Server.
Trong mô hình này, DC server là máy chủ quản lý miền và xác thực người dùng,
đồng thời là máy chủ lưu thông tin quản lý các file và quyền truy nhập file của
người dùng trong DFS. Các File Server là các máy chủ lưu dữ liệu thực sự của
file. Các máy chủ được kết nối trong một mạng LAN tốc độ cao. Để đảm bảo an
toàn cho thông tin quản lý hệ thống file, ta sử dụng thêm 1 máy chủ DC thứ 2
(Secondary DC server) lưu bản sao của thông tin quản lý hệ thống file. Tùy theo
yêu cầu về độ an toàn, tính tin cậy và dung lượng DFS, có thể triển khai số lượng
File Server tương ứng.
13

folder trong một nhóm của một máy sẽ được sao sang folder tương ứng của
nhóm đó trên các máy khác.
Bước 3:
Sau khi hoàn thiện việc cấu hình hệ thống DFS, thử nghiệm tạo mới hoặc
copy file vào từng máy và quan sát quá trình sao sang các máy khác. Khi hệ
thống DFS đã hoạt động tốt, các file thêm mới sẽ được copy tức thời sang máy
khác, đảm bảo tính an toàn dữ liệu trong hệ thống file phân tán. Ngoài 2 máy chủ
đã cài đặt, hệ thống có thể bổ sung thêm các máy chủ lưu dữ liệu nhằm tăng tốc
độ truy nhập và tính tin cậy của hệ thống.
3.2.2 Ứng dụng hệ thống file phân tán và cân bằng tải trên Windows
Server 2008 cho ứng dụng web
Ngoài việc tích hợp dịch vụ hệ thống file phân tán, Windows Server 2008
cũng hỗ trợ tính năng cân bằng tải ở mức mạng, cho phép tạo thành một hệ
thốngcung cấp dịch vụ có tính an toàn, tin cậy cao, khả năng sẵn sàng cao với chi
phí thấp. Trong phần này, luận văn trình bày việc triển khai ứng dựng hệ thống
file phân tán và cân bằng tải trên hệ thống máy chủ đã được cài đặt thử nghiệm
hệ thống file phân tán trong mục 3.2.1 cho ứng dụng web đảm bảo tính sẵn sáng
cao. Các bước triển khai bao gồm:
15

Bước 1: Cài đặt tính năng Network Load Balancing trong từng máy chủ.
Tính năng Network Load Balancing được hỗ trợ trong Windows Server 2008,
cho phép tạo hệ thống cân bằng tải ở mức mạng. Tính năng này cho phép nhóm
nhiều máy chủ vào một chuỗi (Cluster) hoạt động thống nhất và các câu truy vấn
của người dùng được tự động phân phối vào từng máy cho phù hợp. Nếu một
máy không hoạt động, các yêu cầu sẽ được định tuyến vào các máy còn lại.
Bước 2: Cấu hình Network Load Balancing Cluster. Các phần việc cụ thể
gồm:
Tạo mới một cluster và các tham số của cluster;
Thêm các máy chủ và cluster và thêm địa chỉ IP chung cho cluster. Đặt chế

trên DFS của MS Windows 2008. Hệ thống file phân tán có nhiều ưu điểm vượt
trội so với hệ thống file tập trung như dung lượng lưu trữ lớn, độ tin cậy cao, khả
năng chịu lỗi cao, hỗ trợ tốc độ truy cập cao cho nhiều người dùng đồng thời.
Hơn nữa, luận văn cũng cài đặt thử nghiệm ứng dụng hệ thống file phân tán và
cân bằng tải trên Windows 2008 cho ứng dụng web có khả năng sẵn sàng cao.
17

KẾT LUẬN
Luận văn tập trung nghiên cứu hệ thống file phân tán, các kỹ thuật xây
dựng hệ thống file phân tán và xây dựng mô hình triển khai thử nghiệm hệ thống
file phân tán. So với hệ thống file tập trung, hệ thống file phân tán cho phép xây
dựng một hệ thống file đáp ứng các yêu cầu cao về dung lượng lưu trữ, độ tin
cậy, khả năng chịu lỗi và hỗ trợ tốc độ truy cập cao cho nhiều người dùng đồng
thời. Cụ thể, luận văn đã đạt được các kết quả sau:
- Nghiên cứu tổng quan về hệ thống file phân tán, các kỹ thuật xây dựng hệ
thống file phân tán.
- Nghiên cứu sâu về kiến trúc và các đặc điểm kỹ thuật của 4 hệ thống file
phân tán điển hình là NFS, GFS, CIFS và Lustre.
- Xây dựng mô hình ứng dụng hệ thống file phân tán cho doanh nghiệp vừa
và nhỏ.
- Cài đặt thử nghiệm hệ thống file phân tán dựa trên DFS của MS Windows
Server 2008.
- Ứng dụng hệ thống file phân tán và cân bằng tải trên Windows Server
2008 để nâng cao tính sẵn sàng cho ứng dụng web.
Trong tương lai, luận văn có thể được phát triển theo các hướng sau:
- Triển khai hệ thống DFS trên hệ thống mạng thực tế của công ty và có
đánh giá kết quả.
- Nghiên cứu triển khai ứng dụng các hệ thống DFS có hiệu năng và độ tin
cậy cao.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status