Phần I Tổng qua về hệ cơ sở dữ liệu phân tán - Pdf 62

phần I tổng quan về hệ cơ sở dữ liệu phân tán
I. Giới thiệu chung.
Định nghĩa: Hệ CSDL phân tán là một tập hợp dữ liệu mà về mặt logic tập dữ liệu này thuộc về một hệ thống,
nhng đợc trải trên các vị trí khác nhau và chúng có thể kết nối với nhau thông qua một mạng thông tin dữ liệu.
Có hai điểm quan trọng đợc nêu ra trong định nghĩa là:
- Phân tán: Dữ liệu không c trú trên một vị trí, mà đợc phân bố rộng khắp trên nhiều máy tính đặt tại nhiều vị trí
khác nhau.
- Tơng quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau, điều này giúp chúng ta có thể
phân biệt một CSDL phân tán với một tập hợp CSDL cục bộ, các tệp c trú tại các vị trí khác nhau, hay hệ thống CSDL
phân quyền trong một mạng máy tính.
Hệ thống mạng thông tin cho phép ngời dùng chia sẻ dữ liệu, vì vậy ngời sử dụng hoặc ứng dụng ở vị trí A đều
có thể truy cập hay cập nhật dữ liệu tại vị trí B.
Các vị trí của một hệ thống phân tán có thể trải rộng trên một khu vực lớn (toàn thế giới) hoặc một phạm vi hẹp
(toà nhà). Cũng nh vậy máy tính ở các vị trí phân tán có thể là bất cứ loại nào, từ micro-computer cho đến
supercomputer.
II. Các đặc điểm chính của hệ phân tán.
Hệ phân tán có các đặc điểm:
1. Chia xẻ tài nguyên.
Thuật ngữ tài nguyên dùng để chỉ tất cả mọi thứ có thể chia xẻ bởi Hệ phân tán, bao gồm các thiết bị phần cứng:
Đĩa, máy in ... tới các đối tợng nh file, các cửa sổ, CSDL và các đối tợng dữ liệu khác.
Việc chia xẻ tài nguyên trên hệ phân tán - nơi mà các tài nguyên bị lệ thuộc về mặt vật lý với một máy tính nào
đó - đợc thực hiện thông qua truyền thông. Để chia xẻ tài nguyên một cách hiệu quả mỗi tài nguyên cần phải đ ợc
quản lý bởi một chơng trình có giao diện truyền thông, các tài nguyên có thể đợc truy nhập, cập nhật một cách tin cậy
và nhất quán. Quản lý tài nguyên ở đây là lập kế hoạch dự phòng, đặt tên cho các lớp tài nguyên, cho phép tài nguyên
đợc truy nhập từ nơi khác, ánh xạ tên tài nguyên vào địa chỉ truyền thông ...
Mô hình mạng máy tính thờng đợc sử dụng là: Mô hình xử lý Client-Server.
Mô hình xử lý Client-Server:
Là một mô hình trong đó có việc xử lý hợp tác đối với các yêu cầu của Client nêu ra với máy Server. Máy Server
tiến hành xử lý và gửi trả kết quả về cho Client.
Việc xử lý hợp tác Client-Server thực tế là một dạng riêng của xử lý phân tán với tài nguyên (và nhiệm vụ ảnh h -
ởng tới tài nguyên) đợc trải qua hai hay nhiều hệ thống tính toán rời rạc.

- Nếu có khá nhiều thành phần logic của ứng dụng đợc chuyển về Server thì Server sẽ trở thành cổ chai y nh
máy tính lớn (main frame) mô hình thiết bị đầu cuối. Các tài nguyên hạn chế của Server sẽ ở trạng thái bị đòi hỏi làm
việc ở mức cao hơn do việc tăng số ngời tiêu thụ tài nguyên (End User).
- Các ứng dụng phân tán, đặc biệt là những ứng dụng đợc thiết kế cho xử lý hợp tác thờng phức tạp hơn các ứng
dụng không phân tán. Tuy nhiên có thể giảm bớt độ phức tạp bằng cách thu nhỏ vấn đề lớn thành một tập hợp vấn đề
nhỏ hơn, có thể đợc tính độc lập nhau, tơng tự nh trong hệ thiết kế đơn thể.
2. Tính mở.
Tính mở của một hệ thống máy tính là tính dễ dàng mở rộng phần cứng (thêm các thiết bị ngoại vi, bộ nhớ, các
giao diện truyền thông ... ) và phần mềm (Các mô hình hệ điều hành, các giao thức truyên thông, các dịch vụ dùng
chung tài nguyên ...) của nó.
Một Hệ phân tán có tính mở là hệ có thể đợc tạo nên từ nhiều loại phần cứng và phần mềm của nhiều nhà cung
cấp khác nhau với điều kiện là các thành phần này phải theo một tiêu chuẩn chung.
Tính mở của Hệ phân tán đợc xem xét theo mức độ bổ sung vào các dịch vụ dùng chung tài nguyên mà không
phá hỏng hay nhân đôi các dịch vụ đang tồn tại. Tính mở đợc hoàn thiện bằng cách xác định hay phân định rõ các
giao diện chính của một hệ và làm cho nó tơng thích với các nhà phát triển phần mềm (hay các giao diện chính là phổ
dụng).
Tính mở của Hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao
diện dùng để truy nhập các tài nguyên chung.
3. Khả năng song song.
Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy tính có thể có một hay nhiều
CPU. Trong cùng một thời điểm nếu có N tiến trình cùng tồn tại, ta nói chúng đợc thực hiện đồng thời. Việc thực hiện
các tiến trình theo cơ chế phân chia thời gian (một CPU) hay song song (nhiều CPU).
Khả năng làm việc song song trong Hệ phân tán đợc thực hiện do hai tình huống sau:
- Nhiều ngời sử dụng đồng thời đa ra các lệnh hay tơng tác với các chơng trình ứng dụng.
- Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình đáp ứng yêu cầu từ các tiến trình Client.
4. Khả năng mở rộng.
Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiền mức khác nhau. Một Hệ phân tán nhỏ nhất có thể
hoạt động chỉ cần hai trạm làm việc và một File Server. Các hệ lớn hơn thì gồm có hàng nghìn máy, nhiều File Server,
Printer Server.
Khả năng mở rộng của một hệ phân tán đặc trng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng

xây dựng các hệ CSDL phân tán ngày càng phát triển và có nhiều ứng dụng trong thực tế vì các nguyên nhân sau:
1. Xuất phát từ chính yêu cầu thực tế về tổ chức và kinh tế.
Trên thực tế nhiều tổ chức là không tập trung, dữ liệu ngày càng lớn và phục vụ cho đa ngời dùng nằm phân tán
vì vậy CSDL phân tán là con đờng thích hợp với cấu trúc tự nhiên của các tổ chức đó. Đây là một trong các yếu tố
quan trọng thúc đẩy việc phát triển CSDL phân tán.
Một ví dụ minh hoạ cho vấn đề này là hệ thống bán vé máy bay thống nhất trên toàn thế giới. Mỗi hãng hàng
không có một hệ CSDL riêng, có sự quản lý riêng và không thể có lý do nào để CSDL này tập trung ở một chỗ đợc.
Tuy vậy các hãng hàng không lại có quan hệ với nhau trong việc bán vé hành khách cho những tuyến đờng thuộc
phạm vi quản lý của nhiều hãng. Do vậy hệ thống dữ liệu về chuyến bay của các hãng hàng không chính là một hệ
CSDL phân tán đợc quản lý thống nhất tại trung tâm điều khiển bay đặt tại một địa điểm nào đó.
2. Sự liên kết các CSDL đang tồn tại.
CSDL phân tán là giải pháp tự nhiên khi có các CSDL đang tồn tại và sự cần thiết thực hiện xây dựng một ứng
dụng toàn cục. Trong trờng hợp này CSDL phân tán đợc tạo từ dới lên (bottom-up) từ các CSDL đã tồn tại trớc đó.
Tiến trình này có thể đòi hỏi cấu trúc lại cục bộ ở một mức độ nhất định. Dù sao, những sửa đổi này là nhỏ hơn rất
nhiều so với việc tạo lập một CSDL tập trung hoàn toàn mới.
3. Sự phát triển mở rộng.
Các tổ chức có thể mở rộng bằng cách thêm các đơn vị mới, vừa có tính tự trị vừa có quan hệ t ơng đối với các tổ
chức khác. Khi đó CSDL phân tán hỗ trợ một sự mở rộng uyển chuyển với một mức độ ảnh hởng tối thiểu tới các đơn
vị đang tồn tại.
Với CSDL tập trung, cũng có thể khởi tạo kích thớc lớn cho việc mở rộng trong tơng lai. Điều đó rất khó tiên
định và chịu một phí tổn lớn, mặt khác sự mở rộng này có ảnh hởng lớn không chỉ trên các ứng dụng mới mà còn trên
các ứng dụng đang tồn tại.
4. Làm giảm tổng chi phí tìm kiếm.
Việc phân tán dữ liệu cho phép các nhóm làm việc cục bộ có thể kiểm soát toàn bộ dữ liệu của họ. Tuy vậy tại
cùng thời điểm, ngời sử dụng có thể truy cập đến dữ liệu ở xa nếu cần thiết. Tại các vị trí cục bộ, thiết bị phần cứng
có thể đợc chọn sao cho phù hợp với công việc xử lý dữ liệu cục bộ tại điểm đó.
5. Trả lời truy vấn nhanh.
Dựa trên cách thức dữ liệu đợc phân tán, hầu hết các yêu cầu truy vấn dữ liệu từ ngời dùng tại bất kỳ vị trí cục
bộ nào đều đợc thoả mãn bởi dữ liệu ngay tại thời điểm đó. Điều này làm tăng đáng kể tiến trình xử lý các yêu cầu
truy vấn dữ liệu của ngời dùng. Hệ thống CSDL phân tán còn cho phép các bảng truy vấn phức tạp có thể chia thành


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status