BÁO CÁO SEMINAR MÔN HỌC TÍNH TOÁN LƯỚI Tìm hiểu MỘT NGHIÊN CỨU VỀ QUẢN LÝ TÀI NGUYÊN TRONG MÔI TRƯỜNG ĐIỆN TOÁN ĐÁM MÂY - Pdf 26

Mục lục
I. GIỚI THIỆU 4
1. Điện toán đám mây là gì ? 4
2. Quản lý tài nguyên trên môi trường điện toán đám mây 5
3. Các thách thức của quản lý tài nguyên trên môi trường điện toán đám mây 5
4. Bài toán 1: Cung cấp tài nguyên tính toán cho các yêu cầu Batch-job và đặt chỗ 6
5. Bài toán 2: cung cấp tài nguyên tính toán trên hệ thống cloud với tiêu chí tiết kiệm năng
lượng: 7
II. TÌNH HÌNH NGHIÊN CỨU LIÊN QUAN 9
1. So sánh điện toán đám mây và tính toán lưới 9
2. Các phần mềm xây dựng hạ tầng điện toán đám mây (cloud computing) 12
III. KẾT LUẬN 14
IV. Tài liệu tham khảo 14 Trang 2 Các thuật ngữ hay dùng
Tên thuật ngữ bằng tiếng Anh
Ý nghĩa
Cloud computing
Điện toán đám mây
Infrastructure-as-a-Service (IaaS)
Hạ tầng như là dịch vụ: là môi trường điện
toán đám mây cung cấp các dịch vụ của
tạo, hủy, thuê bao, thực thi các máy ảo
(Virtual Machine) chứa ứng dụng của
người dùng, đồng thời trên IaaS còn có các
dịch vụ lưu trữ, quản lý, tính phí,…
Platform-as-a-Service (PaaS)


Trang 4

MỘT NGHIÊN CỨU VỀ QUẢN LÝ TÀI
NGUYÊN TRONG MÔI TRƯỜNG
ĐIỆN TOÁN ĐÁM MÂY
Nguyễn Quang Hùng

I. GIỚI THIỆU
1. Điện toán đám mây là gì ?
Thuật ngữ điện toán đám mây (ĐTĐM) với tên “Compute Cloud” hay phổ biến
là “Cloud computing” là khái niệm mới và có nhiều cách định nghĩa. Định nghĩa về điện
toán đám mây (Cloud computing) sẽ tùy thuộc vào cách chúng ta khai thác, nó có thể
được xem như là một dịch vụ tiện ích cần thiết thứ năm (bên cạnh bốn dịch vụ tiện ích
trong sinh hoạt là điện, nước, điện thoại, gas) . Công nghệ đa nhân (multicore) và công
nghệ ảo hóa (virtualization) phát triển đã hình thành cách thức sử dụng mới – cho phép
chạy nhiều hệ điều hành trên cùng một máy vậy lý. Đồng thời kết hợp với sự phát triển
nhanh của các kỹ thuật phần mềm trên nền tảng Internet – đặc biệt là các chuẩn mở về
Web services (như SOAP, RESTful, XML, WSDL). Sự hội tụ này đã dẫn đến khái niệm
mới trong nhánh tính toán phân bố là điện toán đám mây. Do khái niệm về điện toán đám
mây được hiểu theo các nghĩa khác nhau, chúng ta có thể hiểu điện toán đám mây là khả
năng cung cấp tài nguyên (tính toán – CPU, bộ nhớ vật lý, không gian lưu trữ, v v…)
và phần mềm (kèm theo bản quyền phần mềm) theo nhu cầu dưới dạng tính tiền theo thời
gian sử dụng (pay-as-you-go).
Hiện có ba định nghĩa được chấp nhận trong cộng đồng nghiên cứu về điện toán
đám mây, chúng là các định nghĩa của Rajkumar Buyya (2009) [1], Ian Foster, et.al.
(2008 & 2010) [2] & [3]. Ngoài ra vẫn còn các định nghĩa khác về điện toán đám mây
[4]….
- Theo Ian Foster, et.al. (2008) [2]: “…cloud là dạng Infrastructure-as-a-Service
(IaaS) cloud, như là Amazon EC2. Ở đó, hạ tầng IT được triển khai trong

- Ở góc nhìn nhà cung cấp hạ tầng cloud (Infrastructure-as-a-Service): có hai vấn
đề mà tôi sẽ trình bày cụ thể bên dưới.
- Ở góc nhìn của nhà cung cấp dịch vụ (một loại ứng dụng nào đó) cho người dùng
đầu cuối: ví dụ một công ty ABC cung cấp dịch vụ tài chính trên môi trường
Internet. Thách thức đặt ra với họ là họ hạ thấp nhất chi phí thuê bao tài nguyên
của nhà cung cấp hạ tầng Cloud để chạy ứng dụng, nhưng đồng thời vẫn đáp ứng
chất lượng dịch vụ đối với người dùng cuối.
- Ở góc nhìn người dùng: người dùng muốn thuê tài nguyên đáp ứng tiêu chí ràng
buộc về chất lượng đã ràng buộc với nhà cung cấp dịch vụ hoặc hạ tầng cloud (thể
hiện bằng SLA – Service Level Agreement).
Trang 6

Trong bài viết này, tôi khảo sát hai bài toán (problem) được xác định trong việc
quản lý tài nguyên cho môi trường điện toán đám mây. Trong từng bài toán, tôi khảo sát
một vài hướng tiếp cận :
- Bài toán 1: thách thức trong việc cung cấp (provision) tài nguyên cho cả hai loại :
các yêu cầu cho công việc best-effort (các chương trình mô phỏng yêu cầu tính
toán hiệu năng cao (HPC batch-job)) và các yêu cầu đặt chỗ trên cùng một hệ
thống.
- Bài toán 2: quản lý tài nguyên hiệu quả về năng lượng điện tiêu thụ của cả Data
center.
4. Bài toán 1: Cung cấp tài nguyên tính toán cho các yêu cầu Batch-job và
đặt chỗ
Trong việc cung cấp tài nguyên (tính toán), thường là nhu cầu sử dụng trong thời
gian ngắn (vài giờ). Chúng ta xét vài trường hợp sử dụng tài nguyên sau:
- “một nhà khoa học cần một số lượng lớn các máy tính để chạy một chương trình
giả lập (mô phỏng) trong vài giờ”,
- “một giảng viên ở trường Đại học cần một cluster của 10 nút để dạy thực hành
MPI”,
- “một công ty cần nơi để hosting website của công ty có thể mở rộng (scale

- Lease là khái niệm trừu tượng.
- Máy ảo là hiện thực cho đối tượng được thuê bao (leased).
- Tập trung vào một miền quản trị.
- Hướng hiệu năng cao
- Hỗ trở cả hai loại best-effort và đặt chỗ (advanced reservation).
- Các best-effort job có thể nhường cho yêu cầu đặt chỗ.
5. Bài toán 2: cung cấp tài nguyên tính toán trên hệ thống cloud với tiêu
chí tiết kiệm năng lượng:
Với chủ sở hữu của hệ thống cloud (các data-centers) thì họ muốn giảm chi phí vận hành
hệ thống, trong đó tiền điện là chi phí không nhỏ. Các data-center thường tiêu thụ một
lượng điện rất lớn và tăng mạnh (theo một dự báo của Ủy ban năng lượng của Mỹ), điều
này đồng nghĩa với việc khí thải CO
2
sẽ thải ra môi trường nhiều gây nhiều hậu quả
(global warming). Do đó, một xu hướng khác trong việc quản lý tài nguyên là năng lượng
hiệu quả (Energy-efficient resource management) : Green Cloud [11][12].
Trong việc cung cấp tài nguyên thì bài toán lập lịch tiết kiệm/nhận biết năng lượng được
xây dựng, ví dụ: một số giải thuật lập lịch nhận biết năng lượng đến từ [11][13]…
Trang 8 Hình 1 giải thuật đặt các máy ảo tiết kiệm năng lượng [11]

Hình 2 Giải thuật lập lịch máy ảo dựa trên công suất [13]

Trang 9

II. TÌNH HÌNH NGHIÊN CỨU LIÊN QUAN
1. So sánh điện toán đám mây và tính toán lưới
Phần này trình bày tóm lược so sánh của điện toán đám mây (Cloud computing) và tính

- Mô hình tính toán
(Compute model)
- Quản lý batch-job:
+ Portable Batch System
(PBS), Condor, Sun Grid
Engine (SGE), LSF,…
+ chủ yếu ở hệ thống xếp
hàng (queuing system).
- chia sẻ tài nguyên cho tất
cả người dùng lúc cao điểm
(cả triệu người dùng).

- Data Model
Data Grid
Tính bảo mật và riêng tư
của dữ liệu
Dữ liệu rất lớn (Tbytes) trên
hệ thống vốn có của người
dùng, khi truyền qua mạng
sẽ tốn rất nhiều thời gian.

Trang 11

- Data locality
- Even harder than Cloud
- Shared data stores on
NFS/GPFS/PVFS/Luster
- Need scheduler to be data-
aware


distributed computing: MPI,
MPICH-G2, GridRPC, Pop-
C++,…
- MapReduce
- Mash-up and scripting
- Security Models
- Across many VOs
- Single Sign-On
- Clouds mostly is
dedicated data centers
belong to one
orgranization.
- SSL based
- Trang 12

2. Các phần mềm xây dựng hạ tầng điện toán đám mây (cloud computing)
Hiện nay các lĩnh vực liên quan đến Cloud computing đã trở thành những chủ đề
quan trọng và sự được quan tâm trong các hội nghị khoa học về song song và phân bố nổi
tiếng trên thế giới. Cloud computing cũng hình thành cộng đồng nghiên cứu đông trải
rộng từ Mỹ, Châu Âu, Châu Á, Úc (nhóm Nimbus Toolkit, nhóm CloudLab,…). Các
hướng nghiên cứu chính của Cloud gồm: (i) hướng nghiên cứu xây dựng hạ tầng Cloud
theo mô hình “Infrastructure as a Service” (IaaS) - giống hoặc tương tự Amazon Elastic
Computing Cloud (Amazon EC2) , các công cụ phổ biến như là EUCALYPTUS ,
Nimbus Toolkit , OpenNebulla ; (ii) hướng nghiên cứu xây dựng Cloud dưới dạng
“Platform as a Service” (PaaS) – ví dụ Google AppEngine là một dạng này, cho phép
người dùng với tài khoản của Google có khả năng tạo các ứng dụng trên nền tảng
MapReduce và BigTable ; (iii) hướng nghiên cứu xây dựng mô hình dịch vụ phần mềm

ảo trên cụm các máy tính thực. Nimbus sử dụng một số dịch vụ của Globus Toolkit như
GridFTP để di chuyển (transfer) các ảnh của các máy ảo đến máy tính thực để thực thi.
Nimbus có trang bị Cloud gateway để giao tiếp với các hệ thống Cloud khác.
OpenNebulla với ý tưởng là phát triển các tính năng cho một Cloud hay Hydrid
Cloud như một DataCenter. Kiến trúc của OpenNebulla cho phép chúng ta mở rộng bộ
lập lịch của nó dễ dàng. OpenNebulla có lợi thế là sự hậu thuẫn của dự án EU’s Reservoir
(www. reservoir-fp7.eu) của Ủy Ban Châu Âu và có sự liên kết thực hiện của nhiều nhóm
nghiên cứu ở các trường Đại học khác nhau của Châu Âu (Tây Ban Nha,…).
Trong các hạ tầng Cloud IaaS thương mại thì tuy không phải là nơi đầu tiên đưa ra ý
tưởng Cloud computing, nhưng Amazon Elastic Compute Cloud (Amazon EC2) và
Amazon Simple Storage Service (Amazon S3) là hai trong số các dịch vụ dạng Cloud
được cung cấp bởi Amazon AWS rất thành công hiện nay. Người dùng chỉ cần thẻ tín
dụng (Credit Card, hay Master Card) có khả năng thanh toán qua mạng là có thể đăng ký
tài khoản trên Amazon AWS để thuê các dịch vụ như: thuê chạy một hay nhiều máy ảo
trên Amazon EC2, thuê không gian lưu trữ trên Amazon S3…
Virtual Computing Lab (VCL) đã được quan tâm ở trường Đại học ở Mỹ, một mô
hình điển hình là Virtual Computing Lab của trường Đại học tiểu bang Bắc Carolina. Họ
đã cung cấp mã nguồn mở Apache VCL cho cộng đồng nghiên cứu. Hiện tại Apache
VCL đã được triển khai ở tám trường khác (thông tin trên web site dự án
Mục tiêu của Apache VCL là cung cấp môi
trường tính toán theo yêu cầu cho người dùng có giới hạn thời gian thông qua trình duyệt.
Môi trường tính toán này có thể đơn giản là việc chạy một máy ảo, chạy một ứng dụng
tuần tự hoặc song song (ví dụ: CAD, GIS, các gói phần mềm thống kê, doanh nghiệp…)
trên một cụm máy tính vật lý. Về mặt ý tưởng, người dùng có thể dùng trình duyệt trên
máy tính Desktop hay di động để gửi yêu cầu thực thi một ứng dụng (trên một máy ảo)
qua đường truyền Internet đến bộ lập lịch của Apache VCL, bộ lập lịch sẽ lựa chọn và
thực thi yêu cầu (nếu có), kết quả người dùng có thể tương tác với giao diện ứng dụng từ
xa. Hiện tại, Apache VCL dùng môi trường ảo hóa là VMware ESXi, VMware ESX
Standard Server, VMWare Free Server mà chưa hỗ trợ XEN , Microsoft Hyper-V,…. Bộ
lập lịch của Apache VCL không thể quyết định khi nào máy vật lý sẽ thực thi máy ảo và

[10] B. Sotomayor, K. Keahey, I. Foster, and T. Freeman, “Enabling Cost-Effective Resource
Leases with Virtual Machines,” Hot Topics session in HPDC 2007, Monterey Bay, CA
(USA): 2007, pp. 16-18.
Trang 15

[11] A. Beloglazov and R. Buyya, “Energy Efficient Resource Management in Virtualized
Cloud Data Centers,” 2010 10th IEEE/ACM International Conference on Cluster, Cloud
and Grid Computing, May. 2010, pp. 826-831.
[12] Í. Goiri, F. Julià, R. Nou, and J.L. Berral, “Energy-Aware Scheduling in Virtualized
Datacenters,” 2010, pp. 1-23.
[13] A.J. Younge, G.V. Laszewski, L. Wang, S. Lopez-alarcon, and W. Carithers, “Efficient
Resource Management for Cloud Computing Environments,” To appear in the Work in
Progress in Green Computing with the IEEE International Green Computing Conference
(IGCC), I.A. Behrooz Shirazi, ed., Chicago, IL USA: IEEE, 2010.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status