tìm hiểu kỹ thuật cân bằng tải file server - Pdf 11

ĐỒ ÁN TỐT NGHIỆP
MỤC LỤC
1
ĐỒ ÁN TỐT NGHIỆP
LỜI CẢM ƠN
Lời đầu tiên, nhóm em muốn gửi lời cảm ơn chân thành nhất tới Ths.Trương Tiến
Vũ, người đã trực tiếp hướng dẫn và có những lời góp ý, cùng nhiều tài liệu bổ ích để đề
tài này được hoàn thành.
Em cũng xin chân thành cảm ơn các thầy cô giáo khoa công nghệ thông tin đã tạo
điều kiện học tập và nghiên cứu trong những năm học tập vừa qua. Xin chân thành cảm
ơn các bạn học cùng lớp đã có những lời động viên quý báu trong suốt thời gian thực
hiện đề tài này.
Lời cuối, nhóm muốn gửi lời biết ơn sâu sắc tới gia đình của từng thành viên. Gia
đình luôn là nguồn động viên tinh thần và cổ vũ lớn lao, là động lực giúp nhóm thành
công trong học tập, công việc và cuộc sống.
Đà Nẵng, ngày 10 tháng 1 năm 2013
2
ĐỒ ÁN TỐT NGHIỆP
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
SLB Server load blancing Cân bằng tải máy chủ
NLB Network load blancing Cân bằng tải mạng
DNS Domain Name System Hệ thống tên miền
DFS Distributed File System Phân phối hệ thống tập tin
DANH MỤC HÌNH VẼ
Hình Trang
Hình 1.1. Cách làm việc của Cookie user = 1 11
3
ĐỒ ÁN TỐT NGHIỆP
Hình 1.2. Cookie read 12
Hình 1.3. Cookie – insert 13
Hình 1.4. Bộ cân bằng tải chèn 1 Cookie 14

tán bao gồm mạng vật lý, các nút và các phần mềm điều khiển. Có 5 lý do để xây dựng
một hệ thống mạng phân tán, đó là: chia sẻ tài nguyên, cải tiến sự tối ưu, độ tin cậy, khả
năng truyền thông và độ khả mở. Một trong những vấn đề thú vị nhất của hệ thống mạng
phân tán là cải tiến sự tối ưu của hệ thống qua sự cân bằng tải giữa các nút hay các máy
chủ.
Với lý do trên, em đã lựa chọn đề tài: “Tìm hiểu kỹ thuật cân bằng tải File Server”.
Đây là một vấn đề khá quan trọng trong việc thiết kế các hệ thống mạng hiện nay, các
trung tâm tính toán hiệu năng cao và các trung tâm dữ liệu phục vụ cho các ứng dụng lớn.
II. Mục tiêu
Đề tài này sẽ giúp chúng ta biết được các quá trình cần thiết để có thể cân bằng tải
cho một hệ thống mạng. Giúp ta biết sâu hơn về khái niệm cũng như chức năng cân bằng
tải của File Server 2008.
III. Phạm vi nghiên cứu
Trong quá trình nghiên cứu và tìm hiêu làm đề tài. Có rất nhiều vấn đề về cân bằng tải
trên server và các ứng dụng triển khai trên đó, nhưng ở đề tài này chỉ nghiên cứu một
5
ĐỒ ÁN TỐT NGHIỆP
mảng nhỏ của hệ thống cân bằng tải đó là File Server, nghiên cứu tổng quan về khái niệm
cân bằng tải, các chứng năng chính và phân loại cân bằng tải và cuối cùng là triển khai
giải pháp cân bằng tải trên File Server 2008.
IV. Phương pháp nghiên cứu
Đọc kỹ và nắm bắt các yêu cầu của đồ án đề ra. Đi sâu trong việc tìm kiếm tài liệu và
trình bày một cách hợp lý, chăm chú lắng nghe và tiếp thu những ý kiến đóng góp của
giáo viên hướng dẫn và các thầy cô.
V. Ý nghĩa khoa học và thực tiễn của đề tài
Về mặt lý thuyết, đề tài là một cách tiếp cận trong vấn đề tìm hiểu các vấn đề trong
cân bằng tải trên File Server, tìm hiểu về Windows Server 2008.
Về mặt thực tiễn, đề tài sẽ góp phần nâng cao khả năng tổ chức và triển khai cân bằng
tải trên File Server 2008 vào một hệ thống mạng nội bộ.
CHƯƠNG I: TỔNG QUAN VỀ CÂN BẰNG TẢI

gateway chỉ có nhiệm vụ tạo ra một kết nối hai đối tượng này và không làm gì thêm. Có
thể sử dụng phần cứng hoặc phần mềm được cài đặt trên một front server, hoặc trên chính
web server. Thêm nữa, khi số lượng người dùng tăng lên, để tránh SPOF
[
1
]
, cần thiết phải
1[1] SPOF(Single point of failure): Một điểm trong hệ thống mà nếu nó ngừng hoạt động, toàn bộ hệ
thống sẽ bị tê liệt
7
ĐỒ ÁN TỐT NGHIỆP
cài đặt 2 bộ cân bằng tải song song, hoạt động theo cơ chế active-active hoặc active-
standby.
1.2.1. Kiểm tra trạng thái server
Để chọn được server phù hợp để gửi request, bộ cân bằng tải cần phải biết được
server nào đang có sẵn. Vì vậy, nó cần phải dùng biện pháp nào đó để kiểm tra trạng thái
của server, chằng hạn như gửi lệnh ping, các yêu cầu, thử kết nối hay bất cứ phương pháp
nào mà người quản trị nghĩ là dùng được. Kỹ thuật kiểm tra này thường được gọi là
“health checks”.
Một server bị down có thể trả lời lệnh ping nhưng không thể trả lời các kết nối
TCP, một server bị treo có khả năng trả lời kết nối TCP nhưng không thể trả lời các yêu
cầu HTTP. Khi một ứng dụng web nhiều lớp được kích hoạt, một số yêu cầu HTTP có thể
trả lời ngay lập tức trong khi số khác sẽ thất bại.
Chính vì thế, việc chọn một phương pháp test phù hợp được chấp nhận bởi ứng
dụng web và bộ cân bằng tải là rất thú vị. Một số test đôi khi phải cần truy xuất dữ liệu
database nhằm đảm bảo rằng toàn bộ quá trình của nó là đúng. Hạn chế lớn nhất là những
phương pháp kiểm tra này sẽ chiếm tài nguyên của hệ thống như là CPU, threads…
Do đó, cân bằng thời gian kiểm tra chính là vấn đề khó nhất trong kỹ thuật lựa
chọn server. Khoảng thời gian giữa 2 lần test liên tiếp phải đủ dài để không tốn quá nhiều
tài nguyên của hệ thống và cũng cần đủ ngắn để nhanh chóng phát hiện ra những server

kết đòi hỏi user phải có IP tĩnh trong suốt phiên làm việc.
Vậy thì câu trả lời cuối cùng là gì? Đó chính là sử dụng cookie. Cookie là một đối
tượng được điều khiển bởi Web Servers. Trong kết quả trả về cho người dùng web
servers sẽ chèn thêm một số thông tin. Những yêu cầu tiếp theo của người dùng gửi đến
server sẽ chứa thêm thông tin của cookie này, server sẽ đọc các cookie và biết phải làm gì
với các yêu cầu này.
1.2.4. Cookie
Một cookie được định nghĩa bằng cặp tên=giá trị (name=value). Hình 1.1 miêu tả
hoạt động của cookie với cặp user=1, cho biết tên cookie là user và giá trị của nó là 1.
Bên phía người dùng, cookie được điều khiển bởi trình duyệt và “trong suốt” đối với
người dùng.
9
ĐỒ ÁN TỐT NGHIỆP
Hình 1.1. Cách làm việc của cookie user=1
Trong thiết kế của bộ cân bằng tải, có 3 cách để sử dụng cookie: Cookie chỉ đọc
(Cookie-Read), bộ cân bằng tải chèn cookie nhằm chứng thực server (Cookie-Insert) và
ghi đè cookie (Cookie-Rewrite).
+ Cookie-Read
Cách thức hoạt động của cookie-read được mô tả trong hình 1.2 dưới đây. Khi người
dùng lần đầu tiên gửi yêu cầu đến server, do không có cookie trong yêu cầu, nên nó sẽ
được phân tải đến server RS1 (1). Server RS1 sẽ tạo và đặt cookie server=1 vào trong dữ
liệu trả về cho người dùng (2). Trình duyệt của người dùng sẽ nhận trả về này, đọc thấy
cookies và lưu trữ nó vào trong đĩa cứng (3). Sau đó người dùng có thể đóng trình duyệt
hoặc ngắt kết nối (giả sử rằng trình duyệt của người dùng không tự động xóa cookie sau
khi đóng). Một thời gian sau người dùng kết nối lại và gửi yêu cầu đến bộ cân bằng tải .
Sau khi kết nối được thiết lập, trình duyệt người dùng sẽ gửi cookie server=1 như là một
phần của yêu cầu HTTP (4). Bộ cân bằng tải sẽ đọc được cookie này, và do đó sẽ chuyển
yêu cầu của người dùng vào server RS1. Như vậy người dùng sẽ luôn được kết nối vào
server 1 cho đến khi nào cookie còn tồn tại, cho dù người dùng có thể vào website từ các
địa chỉ IP khác nhau.

12
ĐỒ ÁN TỐT NGHIỆP
Hình 1.4 Bộ cân bằng tải chèn một cookie
+ Cookie-Rewrite
Phương pháp cookie-read không đòi hỏi bộ cân bằng tải phải làm quá nhiều việc
như cookie-insert, trong khi đó cookie-insert lại không yêu cầu ứng dụng phía server phải
tạo cookie còn cookie-read lại cần. Cần phải có một phương pháp dung hòa ưu và nhược
điểm của 2 phương pháp trên. Đó chính là phương pháp ghi đè cookie.
Nhược điểm lớn nhất trong cookie-insert là cần phải có một bộ nhớ phức tạp, và
thêm nữa có thể khiến gói tin bị chia thành 2 (do dung lượng vượt quá giá trị lớn nhất của
gói tin được chấp nhận ở Ethernet) và dẫn đến mất dữ liệu. Chuyện gì sẽ xảy ra nếu như
chúng ta tạo một chỗ trống ở gói tin để lưu giá trị cookie, và bộ cân bằng tải chỉ cần đặt
vào đó giá trị cần thiết. Trong phương pháp ghi đè cookie, được mô tả như hình 1.5 ở
dưới, ứng dụng sẽ chèn vào gói tin trả về một cookie server=XXX. Tất cả những gì bộ
cân bằng tải phải làm là tìm kiếm đoạn server=XXX này và thay “XXX” bằng giá trị ID
của server, chẳng hạn như server=001.
13
ĐỒ ÁN TỐT NGHIỆP
Hình 1.5 Bộ cân bằng tải ghi đè một cookie
Ưu điểm của phương pháp này là tránh cho bộ cân bằng tải làm việc quá mức và
tránh cho gói tin bị chia nhỏ. Bên cạnh đó nó cũng khắc phục được nhược điểm của
phương pháp cookie-read. Nó là phương pháp tốt nhất trong 3 phương pháp đã được đề
cập ở trên và thường được chọn để dùng trong các bộ cân bằng tải.
1.2.5. Cân bằng tải sử dụng phần cứng
Bộ cân bằng tải bằng phần cứng sẽ thể hiện một địa chỉ IP ảo đối với mạng bên
ngoài, địa chỉ này bản đồ hóa đến các địa chỉ của mỗi máy trong một cluster. Chính vì
vậy toàn bộ các máy tính trong cluster sẽ chỉ được xem như là một máy duy nhất đối với
thế giới bên ngoài. Bộ cân bằng tải sử dụng phần cứng thường hoạt động ở tầng mạng và
hoạt động dựa trên sự định tuyến, sử dụng một trong các phương pháp: Định tuyến trực
tiếp (direct routing), tunnelling, IP address translation (NAT).

phát hiện có một nút nào đó bị sự cố thì bộ cân bằng này sẽ chuyển hướng tất cả các
request theo sau được gửi đến nút này sang một nút tích cực khác trong cluster. Mặc dù
vậy, bất kỳ một thông tin session nào trên nút chết sẽ bị mất khi các request được chuyển
hướng đến một nút mới.
Chuyển đổi dự phòng session trong suốt yêu cầu một số kiến thức về sự thực thi
cho một quá trình trong một nút, vì bộ cân bằng tải phần cứng chỉ có thể phát hiện các
vấn đề mức mạng, không có lỗi. Để thực thi một cách trong suốt về vấn đề chuyển đổi dự
phòng, các nút trong cluster phải kết hợp với các nút khác và có vùng bộ nhớ chia sẻ hoặc
cơ sở dữ liệu chung để lưu tất cả các dữ liệu session. Cũng chính vì vậy nếu một nút
trong cluster có vấn đề thì một session có thể tiếp tục trong một nút khác.
• Metrics. Vì tất cả các yêu cầu tới một ứng dụng web đều phải qua hệ thống cân
bằng tải, hệ thống có thể quyết định số lượng session hoạt động, số lượng session hoạt
động được kết nối trong các trường hợp khác nhau, các khoảng thời gian đáp ứng, thời
gian tối đa điện áp, số lượng session trong suốt khoảng tối đa điện áp, số lượng session
trong suốt khoảng tối thiểu điện áp… Tất cả các thông tin kiểm định này được sử dụng để
tinh chỉnh toàn bộ hệ thống nhằm tối ưu hiệu suất.
1.2.6 Cân bằng tải máy chủ với phần mềm
Kết hợp nhiều server một cách chặt chẽ tạo thành một server ảo (virtual server).
Các hệ điều hành cho máy chủ thế hệ mới của các hãng Microsoft, IBM, HP hầu hết
đều cung cấp khả năng này, một số hãng phần mềm khác như Veritas(Symantec) cũng
cung cấp giải pháp theo hướng này. Các giải pháp thuộc nhóm này có ưu điểm là quen
thuộc với những nhà quản trị chuyên nghiệp, có thể chia sẻ được nhiều tài nguyên trong
hệ thống, theo dõi được trạng thái của các máy chủ trong nhóm để chia tải hợp lý. Tuy
16
ĐỒ ÁN TỐT NGHIỆP
nhiên, do sử dụng phần mềm trên server, tính phức tạp cao nên khả năng mở rộng của
giải pháp này bị hạn chế, phức tạp khi triển khai cũng như khắc phục khi xảy ra sự cố, có
rào cản về tính tương thích, khó có được những tính năng tăng tốc và bảo mật cho ứng
dụng.
1.2.7. Cân bằng tải với proxy

pháp hiệu năng cao, ổn định, mở rộng tốt thì kém thông minh, dễ gây lỗi ứng dụng, tăng
tốc kém(GP chia tải nhờ thiết bị chia kết nối). Trong khi đó, tất cả các yêu cầu về hiệu
năng cao, ổn định, mở rộng tốt, tăng tốc tốt và bảo mật là rất quan trọng đối với các hoạt
động của ngân hàng, chứng khoán và các nhà cung cấp dịch vụ. GP sẵn có của các hãng
chỉ đáp ứng được một phần trong các yêu cầu trên như Module CSS của Cisco, ISA của
Microsoft, hay Netscaler của Citrix).
1.2.9. Xử lý các yêu cầu kết nối tập trung
Thay vì ủy quyền cho DNS việc phân phối những yêu cầu đến các server riêng lẻ
trong một cluster, phuơng pháp xử lý các yêu cầu kết nối tập trung (Centrallized
Connection Routing - CCR) sử dụng một router cục bộ để thực hiện chức năng này.
Hình 1.7. Xử lý các yêu cầu kết nối tập trung
Router hoạt động như một bảng chuyển mạch, phân phối các yêu cầu dịch vụ đến các
node riêng lẻ trong cluster.
Ưu điểm của kĩ thuật CCR:
18
ĐỒ ÁN TỐT NGHIỆP
• Việc định huớng lại cho các kết nối Client đến các server thích hợp trong hệ thống
là hoàn toàn trong suốt với người dùng.
• Tính linh hoạt cao: khi phát hiện một node bị chết, local router sẽ chuyển tất cả
các yêu cầu kế tiếp đến node khác đang hoạt động.
Nhuợc điểm của kĩ thuật CCR:
• Khi kết nối từ client đến routẻ tăng cao toàn bộ hệ thống sẽ gặp tình trạng nút cổ
chai ngay tại thiết bị này.
• Thiết bị router là thiết bị phần cứng nên giá thành cao.
• Khi thiết bị trung tâm hong toàn bộ hệ thống sẽ ngưng hoạt động do đó tính chịu
lỗi thấp.
Tóm lại, kỹ thuật xử lý các yêu cầu kết nối tập trung rõ ràng đã giải quyết được vấn đề
cân bằng tải trên mạng. Tuy nhiên kỹ thuật này có tính chịu lỗi thấp và chi phí cao.
CHƯƠNG II. GIẢI PHÁP CÂN BẰNG TẢI TRÊN FILE SERVER
2.1. GIỚI THIỆU CÂN BẰNG TẢI TRÊN FILE SERVER

2.1.2. Tại sao phải xây dựng hệ thống cân bằng tải
Trong thời đại bùng nổ của công nghệ thông tin hiện nay, mạng máy tính đóng vai
trò ngày càng quan trọng hơn trong hoạt động của các doanh nghiệp, tổ chức cũng như
các cơ quan nhà nước. Thậm chí ở một số đơn vị, chẳng hạn như các công ty hàng không
hoặc ngân hàng lớn, mạng máy tính có thể ví như hệ thần kinh điều khiển hoạt động của
toàn doanh nghiệp. Sự ngừng hoạt động của mạng máy tính hay sự hoạt động kém hiệu
20
ĐỒ ÁN TỐT NGHIỆP
quả của mạng máy tính trong những cơ quan này có thể làm tê liệt các hoạt động chính
của đơn vị, và thiệt hại khó có thể lường trước được.
Chúng ta đều biết các máy chủ là trái tim của của mạng máy tính, nếu máy chủ
mạng hỏng, hoạt động của hệ thống sẽ bị ngưng trệ. Điều đáng tiếc là dù các hãng sản
xuất đã cố gắng làm mọi cách để nâng cao chất lượng của thiết bị, nhưng những hỏng hóc
đối với các thiết bị mạng nói chung và các máy chủ nói riêng là điều không thể tránh
khỏi. Do vậy, vấn đề đặt ra là cần có một giải pháp để đảm bảo cho hệ thống vẫn hoạt
động tốt ngay cả khi có sự cố xảy ra đối với máy chủ mạng. Việc lựa chọn một server đơn
lẻ có cấu hình cực mạnh để đáp ứng nhu cầu này sẽ kéo theo chi phí đầu tư rất lớn và
không giải quyết được các vấn đề đặt ra của các tổ chức. Giải pháp hiệu quả được đưa ra
là sử dụng một nhóm server cùng thực hiện một chức nǎng dưới sự điều khiển của một
công cụ phân phối tải - Giải pháp cân bằng tải. Có rất nhiều hãng đưa ra giải pháp cân
bằng tải như Cisco, Coyote Point, Sun Microsystems với rất nhiều tính nǎng phong
phú. Tuy nhiên, về cơ bản, nguyên tắc cân bằng tải vẫn xuất phát từ những quan điểm kỹ
thuật khá tương đồng. Một kỹ thuật cân bằng tải điển hình là RRDNS (Round Robin
DNS). Với giải pháp này, nếu một server trong nhóm bị lỗi, RRDNS sẽ vẫn tiếp tục gửi
tải cho server đó cho đến khi người quản trị mạng phát hiện ra lỗi và tách server này ra
khỏi danh sách địa chỉ DNS. Điều này sẽ gây ra sự đứt quãng dịch vụ. Sau những phát
triển, từ các thuật toán cân bằng tải tĩnh như Round Robin, Weighted Round Robin đến
các thuật toán cân bằng tải động như Least Connection, Weighted Least Connection,
Optimized Weighted Round Robin và Optimized Weighted Least Connection, kỹ thuật
cân bằng tải hiện nay nhờ sự kết hợp các thuật toán trên ngày càng trở nên hoàn thiện

- Các doanh nghiệp
- Nhà cung cấp dịch vụ ISP
- Trung tâm xử lý dữ liệu
- Chính phủ
- Phòng thí nghiệm
- Trường đại học, viện nghiên cứu…
2.2. Các thành phần của cân bằng tải File Server
2.2.1. Chức năng của các thành phần cân bằng tải File Server
Một giải pháp cân bằng tải phải (Server Load Balancer) có những chức năng sau:
• Can thiệp vào luồng dữ liệu mạng tới một điểm đích.
• Chia luồng dữ liệu đó thành các yêu cầu đơn lẻ và quyết định máy chủ nào sẽ
xử lý những yêu cầu đó.
• Duy trì việc theo dõi các máy chủ đang hoạt động, đảm bảo rằng các máy chủ
này vẫn đang đáp ứng các yêu cầu đến. Nếu máy chủ nào không hoạt động
đúng chức năng, máy chủ đó bắt buộc phải đưa ra khỏi danh sách xoay vòng.
• Cung cấp sự đa dạng bằng việc tận dụng nhiều hơn một đơn vị trong các tình
huống fail-over (fail-over là khả năng tự động chuyển qua các thiết bị dự
phòng khi gặp tình huống hỏng hóc hoặc trục trặc. Việc thực thi này được
thực hiện mà không có sự can thiệp của con người cũng như không có bất sự
cảnh báo nào).
23
ĐỒ ÁN TỐT NGHIỆP
• Cung cấp sự phân phối dự trên sự hiểu biết về nội dung ví dụ như đọc URL,
can thiệp vào cookies hoặc truyền XML.
• Server Load Balancers: Load Balancer là một thiết bị phân phối tải giữa các máy
tính với nhau và các máy tính này sẽ xuất hiện chỉ như một máy tính duy nhất.
Phần dưới đây sẽ thảo luận chi tiết hơn về các thành phần của các thiết bị SLB.
• VIPs: Virtual IP (VIP): là một dạng thể hiện của của cân bằng tải. Mỗi VIP sử
dụng một địa chỉ công khai IP. Bên cạnh đó, một cổng TCP hay UDP sẽ đi kèm
với một VIP như cổng TCP 80 được dành cho luồng dữ liệu của web. Một VIP sẽ

với bất kỳ tham số nào.
- Các cấp độ khác: Rất nhiều sản phẩm cung cấp thêm một vài cấp độ người dùng
trung gian ở giữa hai cấp độ trên, có những quyền giới hạn trên hệ thống.
• Giải pháp dự phòng (Redundancy)
Giải pháp dự phòng rất đơn giản: nếu một thiết bị gặp trục trặc, thiết bị đó sẽ được
thay thế bởi một thiết bị khác mà không hoặc gây ít ảnh hưởng nhất đến hoạt động của
toàn bộ hệ thống. Thiết bị được thay thế sẽ thực hiện những chức năng giống như thiết bị
bị thay thế. Hầu hết các thiết bị trên thị trường đều có khả năng này.
Có một vài cách để thực hiện khả năng này. Cách thông thường nhất là sử dụng hai
thiết bị. Một giao thức sẽ được sử dụng bởi một trong hai thiết bị để kiểm tra tình trạng
hoạt động của thiết bị còn lại. Trong một vài tình huống, cả hai thiết bị đều hoạt động,
đáp ứng các luồng dữ liệu đến. Trong một vài tình huống khác, sẽ chỉ có một thiết bị hoạt
động chính, thiết bị còn lại sẽ được sử dụng trong tình huống hỏng hóc hoặc trục trặc.
• Vai trò của việc dự phòng
Trong giải pháp dự phòng, tồn tại một quan hệ là active - standby. Một thiết bị, hay
còn gọi là thiết bị đang hoạt động thực hiện một vài hoặc đầy đủ các chức năng chính,
trong khi đó thiết bị dự phòng sẽ đợi để thực hiện những chức năng này. Mối quan hệ này
cũng có thể được gọi là mối quan hệ master/slave.
Trong những tình huống nhất định, cả hai thiết bị sẽ là chủ (master) trong một vài
chức năng và làm phục vụ (slave) trong một vài chức năng khác nhằm phân tán tải. Cũng
25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status