HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO
THỰC TẬP TỐT NGHIỆP
Nội dung:Tìm hiểu về công nghệ Gird
Computing và ứng dụng
Nơi thực tập : Viện CNTT&TT-CDIT
Người hướng dẫn : Cô Lê Thị Hà
Người báo cáo : S.v Phạm Ngọc Dũng
Hànội, Ngày 16 Tháng 7 Năm 2012
1
LỜI CẢM ƠN
Để hoàn thành báo cáo thực tập này không thể thiếu sự hỗ trợ của các thầy cô, các
cô chú tại đơn vị thực tập. Em xin bày tỏ lòng biết ơn: Ban Giám Hiệu HV CN BC-VT
giới thiệu em đến cơ quan thực tập là trung tâm công nghệ CDIT và Ban Giám Đốc trung
tâm CDIT đã đồng ý cho em thực tập tại trung tâm .
Xin gửi lời cảm ơn sâu sắc nhất tới Cô Lê Thị Hà, người đã tận tình hướng dẫn,
giúp đỡ em hoàn thành báo cáo này. Xin chân thành cảm ơn các Thầy cô giáo trong Khoa
CNTT I - Học viện Công nghệ bưu chính viễn thông - những người đã trang bị cho em
những kiến thức quý báu trong quá trình học tập.
Với thời gian thực tập tại trung tâm có hạn, với sự hướng dẫn nhiệt tình của cán
bộ kỹ thuật tại Trung tâm em đã cố gắng tìm hiểu về đề tài thực tâp đã được giao, củng cố
thêm kiến thức thực tế cho bản thân, em mong muốn rằng được sự chỉ bảo của các thầy cô
trong bộ môn em sẽ có kiến thức vững vàng hơn để phục vụ tốt cho công việc sau này.
Do trình độ còn nhiều hạn chế, nên Báo cáo của em chưa phản ánh được đầy đủ,
chính xác các nội dung như mong muốn và chắc chắn không tránh khỏi những thiếu sót.
Em rất mong các thầy cô giáo và các bạn đóng góp ý kiến để Báo cáo của em được đầy đủ
và hoàn thiện hơn.
2
MỤC LỤC
MỤC LỤC___________________________________________________________________3
2. Tài nguyên đa dạng hỗn tạp 19
3. Việc tồn tại của tài nguyên trong Grid thay đổi theo thời gian 20
4.Vấn đề phối hợp cấp phát tài nguyên 20
5. Vấn đề điều khiển trực tuyến, theo thời gian thực (online) 20
4.2 Bảo mật______________________________________________________________21
1.Đăng nhập một lần (Single sign-on) 21
2.Cho phép ủy quyền 21
3.Có khả năng tích hợp được với các chính sách bảo mật cục bộ 21
4.Sử dụng các quan hệ tin cậy lẫn nhau dựa theo người dùng 21
5.Hỗ trợ bảo mật liên lạc nhóm 21
3
6.Đảm bảo tính riêng tư 21
7.Cho phép có nhiều cài đặt khác nhau 22
4.3 Quản lý thông tin______________________________________________________22
4.4 Quản lý dữ liệu________________________________________________________22
4.5 Phát triển ứng dụng____________________________________________________23
5. Ích lợi và ứng dụng_______________________________________________________23
1.Khai thác, tận dụng các tài nguyên nhàn rỗi.__________________________________23
2. Sử dụng CPU song song__________________________________________________24
3.Cho phép hợp tác trên toàn thế giới 24
4.Cho phép chia sẻ, sử dụng tất cả các loại tài nguyên 24
5.Tăng tính tin cậy cho các hệ thống máy tính 24
6.Tăng khả năng quản trị các hệ thống 25
III . Giới thiệu về bộ Globus Toolkit 4.0__________________________________________25
1 . Tổng quan về Globus Toolkit 4.0___________________________________________25
2. Các thành phần thường trực_______________________________________________25
2.1 Java WS core_________________________________________________________26
2.2 C WS Core___________________________________________________________26
2.3 Python WC Core_______________________________________________________26
3. Các thành phần bảo mật__________________________________________________26
2. Phân tích hệ thống_______________________________________________________40
3. Thiết kế hệ thống________________________________________________________43
4.Kết quả thử nghiệm_______________________________________________________47
4.1 Viết mã chương trình___________________________________________________47
4.2 Giao diện chương trình client_____________________________________________48
4.3 Chạy chương trình_____________________________________________________48
5.Kết luận về bài toán số nguyên tố___________________________________________50
VI. Lời kết__________________________________________________________________50
Tài liệu tham khảo___________________________________________________________50
5
Phần A : GIỚI THIỆU ĐƠN VỊ THỰC TẬP
I. Lịch sử thành lập:
Trung tâm Công nghệ Thông tin CDIT được Tổng giám đốc Tổng Công ty Bưu chính Viễn
thông Việt Nam ký quyết định thành lập số 636/QĐ.TCCB-LĐ ngày 22 tháng 3 năm 1999, trên
cơ sở sắp xếp lại hai đơn vị thành viên của các đơn vị trực thuộc Học viện Công nghệ Bưu chính
Viễn thông :
1 1) Trung tâm Nghiên cứu Phát triển Phần mềm thuộc Viện KHKT Bưu điện.
2 2) Trung tâm Đào tạo Phát triển Phần mềm thuộc Trung tâm Đào tạo BCVT1 (cũ).
II. Chức năng và lĩnh vực hoạt động
Trung tâm Công nghệ Thông tin CDIT có nhiệm vụ: nghiên cứu, phát triển, triển khai sản
phẩm, chuyển giao công nghệ và đào tạo trong lĩnh vực Công nghệ Thông tin phục vụ Ngành Bưu
chính Viễn thông và xã hội.Các chức năng chính 1. Nghiên cứu khoa học công nghệ; 2. Phát triển,
triển khai công nghệ và sản phẩm; 3. Sản xuất phần mềm và thiết bị; 4. Tiếp nhận và chuyển giao
công nghệ; 5. Đào tạo và bồi dưỡng nhân lực.
III. Tổ chức
6
Phần B : NỘI DUNG THỰC TẬP
I. Phần giới thiệu chung
Grid potology.
Từ ngày 25/6 đến
ngày 30/6
Các kiểu Grid,đồ
hình grid
- ích lợi và ứng dụng
grid
_Kiến trúc Grid và
chuẩ hóa grid
-
4 Giới thiệu về bộ Globus Toolkit
4.0
Từ ngày 1/7 đến
ngày 8/7
- Các công nghệ
chuẩn liên quan
- Kiến trúc của
Globus Toolkit 4.0
- Các thành phần
7
5 Phát triển ứng dụng Globus
Toolkit 4.0
Từ ngày 9/7 đến
ngày 15/7
-Triển khai cài đặt
hệ thống
6 Phân tích thiết kế,cài đặt thử
nghiệm ứng dụng
Từ ngày 15/7 đến
ngày 22/7
toán. Với công nghệ này, ta có thể chia sẻ tài nguyên và liên kết các tổ chức lại với nhau. Đây còn
gọi là công nghệ ảo hóa. Để có được một môi trường hỗn hợp có thể chia sẻ tài nguyên, ngoài
công nghệ ảo hóa, Grid còn dùng các công nghệ khác trong các lĩnh vực lập lịch, tài chính, bảo
mật,.v.v.
8
Sự ảo hóa trong môi trường grid có nhiều cấp độ khác nhau. Mỗi cấp độ phụ thuộc vào
phạm vi và tính đồng nhất của tổ chức. Hình 1 mô tả từng cấp độ của sự ảo hóa từ đơn giản đến
phức tạp khi đi theo chiều từ trái sang phải. Ở hình trái nhất là tổ chức đồng nhất, đơn tài nguyên.
Tài nguyên ở đây có thể là CPU, ổ lưu trữ,các thiết bị và chương trình. Tiếp đến là hệ thống hỗn
hợp gồm nhiều tài nguyên khác nhau. Cấp độ ảo hóa phức tạp hơn là ảo hóa trong một xí nghiệp.
Hình dưới đây là mức độ ảo hóa cao nhất với phạm vi trên toàn mạng Internet, bao gồm các đa tổ
chức hỗn hợp.
2. Lợi ích của Gird Computing
2.1 Khai thác tài nguyên xử lý
Một trong những tính năng cơ bản của tính toán mạng lưới là khả năng chạy một chương
trình trên nhiều máy tính khác nhau. Trong một mạng lưới bao gồm nhiều máy tính, có một số
máy ở trạng thái bận do khối lượng công việc lớn, một số khác ở trạng thái rỗi do khối lượng công
việc nhỏ.
Trong hầu hết các tổ chức, luôn có những khối lượng lớn những tài nguyên dùng để tính
toán. Trung bình mỗi ngày, mỗi máy tính có thời gian trung ở trạng thái thái bận là 5%. Điều đó
chứng tỏ khối lượng tài nguyên rỗi trong một mạng là rất lớn. Grid cung cấp một khung làm việc
(framework) để tận dụng những tài nguyên này và vì thế có thể tăng hiệu quả trong việc sử dụng
các tài nguyên.
Ngoài tài nguyên xử lý, tài nguyên lưu trữ cũng được sử dụng hiệu quả hơn nhờ Grid
computing. Grid tận dụng các dung lượng đĩa cứng còn trống trong các máy tính để tập hợp thành
một tài nguyên lưu trữ ảo trọng mạng.
Hình 1: Sự ảo hóa với nhiều cấp độ
9
2.2 Khả năng xử lý song song
Khả năng kết hợp nhiều CPU cùng xử lý song song là một tính năng hấp dẫn của Grid
Những người tham gia hay sử dụng grid là một thành viên trong một tổ chức nào đó. Grid
có thể yêu cầu người dùng đó tuân thủ các luật lệ, quyền hạn sử dụng, từ đó có thể giải quyết
được các vấn đề về ưu tiên, bảo mật,
10
Hình 2: Mạng grid ảo không đồng nhất
2.4 Sự truy cập tớ các tài nguyên khác
Ngoài CPU và tài nguyên lưu trữ, Grid còn có thể truy nhập đến những tài nguyên khác.
Các tài nguyên này có thể được cung cấp dưới dạng số lượng hoặc khả năng lưu trữ, băng thông.
Ví dụ, nếu một người muốn tăng băng thông truy nhập Internet để thực hiện việc khai thác dữ liệu
tìm kiếm, công việc này có thể phân chia giữa các máy trong mạng grid có đường truyền Internet
không phụ thuộc nhau. Trong trường hợp này, khả năng tìm kiếm được nhân lên, khi mỗi máy có
đường truyền riêng biệt. Nếu các máy chia sẻ đường kết nối Internet, thì nó sẽ không tăng băng
thông.
Trong một mạng lưới, một số máy tính nào có thể được cài đặt những phần mềm đắt tiền,
có bản quyền mà một máy khác không có. Người sử dụng máy tính không cài đặt phần mềm đó
có thể sử dụng phần mềm này bằng cách gửi công việc đến máy tính được cài phần mềm để yêu
cầu xử lý. Đó là khả năng tận dụng phần mềm của Grid.
Một vài máy tính có thể có những thiết bị đặc biệt, chẳng hạn như máy in. Hầu hết các máy
in được sử dụng từ xa. Grid có thể chia sẽ được những thiết bị đặc biệt này. Thậm chí grid có thể
chia sẻ những thiết bị, tài nguyên phức tạp như máy chuẩn đoán bệnh hay robot hỗ trợ phẫu thuật.
2.5 Cân bằng tài nguyên
Grid liên kết các tài nguyên từ nhiều máy khác nhau tạo thành một hệ thống duy nhất.
Grid có thể thực hiện cân bằng tài nguyên trong các chương trình bằng cách lập lịch làm việc cho
các công việc, như hình 3 dưới đây. Chức năng này có ý nghĩa rất lớn trong việc xử lý các trường
hợp quá tải về xử lý, tính toán trong một tổ chức. Chức năng cân bằng có thể được thực theo 2
cách sau:
11
Đôi khi có những công việc đột ngột được tăng độ ưu tiên do cần hoàn thành gấp. Grid không thể
xử lý được những công việc cần hoàn thành quá gấp. Tuy nhiên grid có thể phân chia nó thành
nhiều công việc nhỏ và huy động một lượng lớn tài nguyên để xử lý nó một cách nhanh nhất.
chi phí của nó. Có thể những tài nguyên đang rỗi trong khi các dự án khác gặp sự cố, cần thêm
những tài nguyên khác. Với tầm nhìn bao quát, grid có thể giải quyết dễ dàng tình huống này.
Trong hình 5, nhà quản lý có thể thay đổi các quyền hạn với tài nguyên để các tổ chức khác có thể
chia sẻ hay sử dụng.
13
Hình 5: Nhà quản trị có thể điều chỉnh chính sách thích hợp với tài nguyên
3. Tìm hiểu phân loại Grid và Grid potology.
3.1 Các kiểu Gird computing
Công nghệ Grid Computing có thể được sử dụng theo nhiều cách khác nhau để giải quyết
các loại yêu cầu ứng dụng . Thông thường Grid được phân loại bởi kiểu của ứng dụng cần giải
quyết. Có 3 loại Grid như trình bày dưới đây . Tuy nhiên không có ranh giới phân biệt rõ ràng
giữa các loại Grid và trong thực tế, các giải pháp Grid thường là sự kết hợp 2 hay nhiều loại khác
nhau.
3.1.1 Gird tính toán (Computation Gird)
Loại Grid này tập trung chủ yếu vào việc sử dụng năng lực tính toán. Ở dạng Grid này,
phần lớn các node là các máy tính hay các nhóm máy tính(cluster) có năng lực xử lý, tính toán rất
lớn.
Hình thức thực hiện là chia tác vụ tính toán lớn thành nhiều công việc nhỏ thực thi song
song trên các node của Grid. Việc phân tán các tác vụ tính toán trong Grid sẽ làm giảm rất đáng
kể toàn bộ thời gian xử lý và tăng khả năng tận dụng hệ thống. Thông thường một hệ thống chính
sẽ chia khối dữ liệu cần xử lý thành các phần nhỏ, sau đó phân phối đến các node trên Grid. Mỗi
node sẽ thực hiện xử lý dữ liệu và trả kết quả về hệ thống chính để hệ này tổng hợp và trình diễn
kết quả toàn cục cho người dùng. Hình 6 minh họa quá trình này.
14
Hình 6: Hình thức hoạt động của Grid Tính toán
3.1.2 Gird dữ liệu (Data Gird)
Ở đây, không gian lưu trữ là tài nguyên. Một Grid Dữ liệu chịu trách nhiệm lưu trữ và cung
cấp khả năng truy cập dữ liệu cho nhiều tổ chức khác nhau. Người dùng không cần biết chính xác
cần các chính sách đặc biệt về quản lý cũng như bảo mật. Các máy tính chạy cùng hệ điều hành,
cùng kiến trúc phần cứng nên việc chọn các phần mềm ứng dụng khá đơn giản, dễ dàng. Đồ hình
này khiến người ta liên tưởng đến các cluster hơn là Grid.
3.2.2 IntraGird
Hình 2-5 mô tả một Intra Grid.
Mở rộng hơn một chút so với SimpleGrid là IntraGrid. Lúc này xuất hiện các hệ thống
không đồng nhất, nhiều loại tài nguyên mới trong Grid. Sử dụng cùng một chính sách bảo mật, sử
dụng mạng nội bộ để kết nối các hệ thống trong Grid là các đặc tính quan trọng của đồ hình này.
Hệ thống Grid cần có các module lập lịch. Việc chia sẻ file có thể sử dụng các hệ thống file
mạng (network filesytem). Các máy tính tham gia Grid có thể thuộc nhiều phòng ban khác nhau
nhưng vẫn trong cùng một tổ chức.
Khi Grid mở rộng ra nhiều phòng ban, các chính sách mới về cách sử dụng Grid cần phải
được xác lập và áp dụng. Ví dụ: cần phải có chính sách quy định những công việc nào được thực
hiện trên Grid, vào thời điểm nào; độ ưu tiên của các phòng ban,… Bên cạnh đó vấn đề bảo mật
cũng cần được quan tâm, các dữ liệu nhạy cảm của một phòng ban cần được bảo vệ khỏi sự truy
cập từ các công việc của các phòng ban khác.
Các máy tính dành riêng cho Grid bắt đầu được đưa vào để làm tăng chất lượng dịch vụ
của Grid, thay vì phải trông chờ vào các tài nguyên rảnh rỗi.
3.2.3 ExtraGird
Vẫn trong cùng một tổ chức, ExtraGrid là sự kết hợp 2 hay nhiều IntraGrid. Như trong
hình 10, ExtraGrid liên quan đến nhiều vùng quản lý khác nhau, phân tán theo địa lý, sử dụng các
kết nối truy cập từ xa hay WAN, do đó độ phức tạp trong quản lý tăng lên rất nhiều. Đối với
ExtraGrid, các tài nguyên mang tính động hơn, Grid cần phải linh động trong việc quản lý các tài
nguyên, cần có cơ chế kiểm soát và phục hồi lỗi.
Cần có các dịch vụ cung cấp thông tin (information service) để tìm kiếm tài nguyên.
17
Hình 10 Đồ hình ExtraGrid
sẻ được thực hiện.
2. Tài nguyên đa dạng hỗn tạp
Grid phải quản lý nhiều tài nguyên không đồng nhất về bản chất, sử dụng nhiều công nghệ,
các hệ thống quản lý tài nguyên cục bộ khác nhau. Ngay cả khi có 2 site cùng sử dụng một công
nghệ, một hệ quản lý tài nguyên cục bộ nhưng có cấu hình khác nhau cũng dẫn đến có các chức
năng khác nhau.
Dưới đây là bảng đặc tính các đối tượng cần quản lý cho thấy sự phức tạp trong quản lý tài
nguyên:
19
Bảng 2-1 Các đặc tính của tài nguyên.
3. Việc tồn tại của tài nguyên trong Grid thay đổi theo thời gian
Trong Grid, các tài nguyên có thể xuất hiện hoặc biến mất mà không hề báo trước do nhiều
nguyên do khác nhau như lỗi hệ thống, lỗi mạng, các chính sách chia sẻ của nhà cung cấp,…
Đâycũng là một thách thức lớn để đảm bảo tính tin cậy của hệ thống. Cần có các cơ chế tìm kiếm,
xác định tài nguyên, phát hiện và phục hồi lỗi.
4.Vấn đề phối hợp cấp phát tài nguyên
Các ứng dụng có nhiều đòi hỏi về tài nguyên mà chỉ có thể đáp ứng bằng cách sử dụng
song song các tài nguyên trên nhiều site khác nhau. Các chính sách quản trị cục bộ của các site
cùng với khả năng bị lỗi trong quá trình cấp phát tài nguyên đòi hỏi phải có các cơ chế đặc biệt để
phối hợp cấp phát nhiều tài nguyên, khởi tạo các quá trình tính toán, theo dõi, và quản lý chúng
trên các tài nguyên.
5. Vấn đề điều khiển trực tuyến, theo thời gian thực (online)
Cần có cơ chế cho phép thoả thuận sử dụng tài nguyên trong thời gian thực thi để đáp ứng
nhu cầu của ứng dụng, nhất là trong trường hợp các yêu cầu và tính chất các tài nguyên thay đổi
trong quá trình thực thi.
20
4.2 Bảo mật
Các hệ thống Grid cần phải cung cấp đầy đủ các chức năng bảo mật truyền thống như
chứng thực, phân quyền, bảo vệ thông điệp, toàn vẹn dữ liệu, … ngoài ra cần đáp ứng các yêu cầu
sau:
7.Cho phép có nhiều cài đặt khác nhau
Các giải pháp bảo mật không nên chỉ tập trung vào một cài đặt cụ thể mà nên cài đặt theo
nhiều công nghệ khác nhau dựa trên một nền tảng chung. Điều này đảm bảo tính tương thích với
nhiều hệ thống khác nhau.
4.3 Quản lý thông tin
Hệ thống thông tin Grid cần có các cơ chế hỗ trợ việc truy cập, tìm kiếm thông tin các
loại về hệ thống Grid một cách nhanh chóng, chính xác. Cần có các chức năng để xác định đặc
tính phần cứng, phần mềm cũng như các thông tin trạng thái như tải hiện tại và trạng thái hàng đợi
trong trường hợp tài nguyên được lập lịch sử dụng và có các cơ chế cung cấp các thông tin này
gần như theo thời gian thực.
Hệ thống thông tin cần hỗ trợ theo dõi thông tin của một lượng rất lớn các thành phần, cho
phép nhiều loại thực thể truy cập, tìm kiếm thông tin trong khi giảm thiểu các chi phí về công sức
và tài nguyên cần thiết để tạo lập, cập nhật các thông tin cả ở từng site lẫn toàn bộ Grid.
Một trong những mục tiêu của hệ thống thông tin là đơn giản hoá việc tìm kiếm thông tin
để ra các quyết định sử dụng tài nguyên thích hợp, do đó hệ thống thông tin cần phải được xây
dựng theo mô hình dữ liệu đơn nhất (uniform), cung cấp một giao diện chung để truy xuất nhiều
thông tin khác nhau,
Mô hình quản lý thông tin cần đủ bao quát để biểu diễn các cấu trúc thông tin trong môi
trường tính toán phân tán. Một trong những thách thức là biểu diễn được các thuộc tính liên quan
đến nhiều site cùng lúc (ví dụ như : băng thông liên lạc giữa các site).
Do tài nguyên của Grid rất đa dạng, có thể được thêm bớt theo thời gian, do đó khả năng
tích hợp thêm các thông tin mới vào hệ thống là rất quan trọng. Các hệ hống thông tin Grid cần
phải có khả năng này.
Các hệ thống thông tin Grid cần có khả năng phát sinh thông tin từ nhiều guồn khác nhau
để cung cấp các thông tin tổng hợp về hệ thống.
Đưa ra các cách thức truy xuất mềm dẻo đến hệ thống thông tin, người dùng cần có khả
năng đọc, cập nhật cùng với khả năng tìm kiếm, định vị thông tin.
Hệ thống thông tin chỉ có thể hữu dụng khi nó được triển khai rộng rãi, do đó cần có những
kỹ thuật cho phép cài đặt, triển khai, bảo trì dễ dàng trên các site khác nhau.
Cần có mô hình quản lý thông tin phân tán, nên cho phép uỷ quyền tạo lập và quản lý
…
Grid cho phép kết hợp nhiều không gian lưu trữ nhàn rỗi để tạo thành một không gian lưu
trữ lớn hơn, được cấu hình để tăng hiệu suất, độ tin cậy hơn so với các máy đơn lẻ thông qua các
cơ chế quản lý dữ liệu.
Một chức năng của Grid nữa là cân bằng sử dụng tài nguyên tốt hơn. Một tổ chức thường
gặp các vấn đề không mong đợi khi các hoạt động đòi hỏi thêm nhiều tài nguyên hơn. Với Grid,có
thể chuyển hoạt động đến các tài nguyên nhàn rỗi khác, hoặc có thể thêm các tài nguyên mới
một cách dễ dàng, từ đó làm tăng khả năng chịu đựng của hệ thống. Grid có thể quản lý nhiều loại
tài nguyên, do đó có hể cho phép theo dõi tổng quan về các hoạt động sử dụng tài nguyên trong
các tổ chức lớn, hỗ trợ hoạch định các chiến lược sử dụng tài nguyên.
23
2. Sử dụng CPU song song
Khả năng sử dụng các CPU song song là một đặc tính tuyệt vời của Grid, ngoài việc hỗ trợ
các nhu cầu tính toán của các nhà khoa học, sức mạnh tính toán do Grid cung cấp có thể giúp giải
quyết các bài toán đòi hỏi năng lực xử lý lớn trong các ngành khác như y dược, tính toán tài
chính, kinh tế, khai thác dầu hoả, dự báo thời tiết, công nghiệp vũ trụ, thiết kế sản phẩm, … và rất
nhiều lĩnh vực khác.
3.Cho phép hợp tác trên toàn thế giới
Một trong những đóng góp quan trọng của công nghệ Grid Computing là cho phép và đơn
giản hoá hợp tác chia sẻ, làm việc giữa một cộng đồng rộng lớn trên toàn thế giới. Các công nghệ
tính toán phân tán trước đây cũng cho phép hợp tác nhưng chỉ trong một phạm vi nhỏ, còn Grid
cho phép mở rộng trên phạm vi toàn cầu khi đưa ra những chuẩn quan trọng cho phép các hệ
thống không đồng dạng làm việc chung với nhau để tạo nên một hệ thống tính toán ảo cung cấp
rất nhiều dạng tài nguyên khác nhau.
4.Cho phép chia sẻ, sử dụng tất cả các loại tài nguyên
Không chỉ cho phép chia sẻ các chu kỳ tính toán, dữ liệu, Grid có thể cho phép chia sẻ tất
cả các loại tài nguyên mà trước đây chưa được chia sẻ, như băng thông mạng, các thiết bị đặc
biệt, phần mềm, bản quyền, các dịch vụ,… Ví dụ, nếu một người dùng muốn tăng băng thông kết
nối Intenet của mình lên để thực hiện một ứng dụng khai thác dữ liệu, ứng dụng đó có thể được
gửi đến nhiều máy tính trong Grid có các kết nối Internet riêng, từ đó băng thông truy cập Internet
III . Giới thiệu về bộ Globus Toolkit 4.0
1 . Tổng quan về Globus Toolkit 4.0
Bộ công cụ Globus Toolkit 4.0 là tập hợp các thành phần mã nguồn mở, cung cấp nền
tảng cho môi trường phát triển và các ứng dụng Grid computing. Phiên bản 4 của bộ công cụ là
phiên bản đầu tiêu hỗ trợ dịch vụ Web - WSRF (Phiên bản 3 hỗ trợ OGSI, còn phiên bản 2 thì
không hỗ trợ các chuẩn trên). Và được chia ra hai phần: Một thành phần là nền tảng cho dịch vụ
Web, một thành phần là nền tảng cho các dịch vụ khác.
Globus Tookit 4.0 cung cấp các thành phần được chia theo các danh mục sau:
• Các thành phần thường trực
• Các thành phần bảo mật
• Các thành phần quản lý dữ liệu
• Các dịch vụ kiểm tra và khám phá thông tin
• Các thành phần quản lý thi hành
2. Các thành phần thường trực
Globus Toolkit 4.0 chứa các thành phần thường trực. Thành phần thường trực là thành phần
bao gồm các thư viện và công cụ làm cốt lõi cho mạng Grid computing và là nền tảng cho các
thành phần khác. Các thành phần thường trực bao gồm: Java WS Core, C WS Core, Python WS
Core.
25