1
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
“ SỰ GẮN BÓ THÔNG TIN TRONG HỆ QUẢN TRỊ
CƠ SỞ DỮ LIỆU PHÂN TÁN “
TIỂU LUẬN
TIỂU LUẬN
MÔN HỌC: HỆ TIN HỌC PHÂN TÁN
MÔN HỌC: HỆ TIN HỌC PHÂN TÁN
HVTH : TRỊNH SỬ TRƯỜNG THI
GVHD: PGS.TS. LÊ VĂN SƠN
Đà Nẵng, 06 - 2007
ĐỀ 2:
Trang 2
PHẦN I:
LÝ THUYẾT
1. Khái quát về CSDL phân tán
2. Triển vọng và các yếu tố phức tạp của
CSDL phân tán
3. Sự gắn bó thông tin trong CSDL phân
tán
Trang 3
I. KHÁI QUÁT VỀ CSDL PHÂN TÁN
Giới thiệu
Xử lý dữ liệu phân tán
Hệ CSDL Phân tán là gì?
Công nghệ về các hệ cơ sở dữ liệu phân tán (distributed
Do nhu cầu tích hợp CSDL của các công ty, xí nghiệp để
khai thác tập trung.
Công nghệ mạng máy tính: đi ngược lại với mọi nỗ lực tập
trung hóa (phân tán)
Tổng hợp hai hướng tiếp cận trái ngược nhau cho ra một
công nghệ mạnh mẽ, nhiều hứa hẹn. Mục tiêu quan trọng
nhất của CSDL là tích hợp (integratior) chứ không phải tập
trung hoá (centralization)
1. Giới thiệu (tt)
Trang 6
Định nghĩa:
CSDL phân tán: là một tập nhiều cơ sở dữ liệu có
liên đới logic và được phân bố trên một mạng
máy tính.
Hệ quản trị CSDL phân tán (distributed database
management system): là một hệ thống phần mềm
cho phép quản trị các CSDL phân tán và làm cho
việc phân tán trở nên “vô hình” đối với người sử
dụng.
2. Hệ CSDL phân tán là gì?:
Trang 7
Trạm 1
Trạm 1
Trạm 3
Trạm 3
Trạm 4
Trạm 4
tách ra khỏi chi tiết hoạt động của mạng.
Trang 10
-
Vô hình nhân bản: Phân bố dữ liệu theo lối nhân dữ liệu thành
nhiều bản sao nằm rải rác trên mạng Tăng hiệu năng, độ tin cậy,
tính sẵn sàng
-
Vô hình phân mảnh (fragmentation transparency): Nhu cầu tách
mỗi quan hệ thành các mảnh dữ liệu nhỏ hơn và xử lý các mảnh
này như 1 đối tượng CSDL độc lập
1.2 Độ tin cậy qua các giao dịch phân tán:
-
Do có các thành phần được nhân bản loại bỏ được các tình
huống sự cố tại các điểm riêng lẻ.
-
Dữ liệu tại các điểm sự cố sẽ được phục hồi sau khi khắc phục.
1. Triển vọng của các hệ CSDL phân tán
Trang 11
1. Triển vọng của các hệ CSDL phân tán
1.3 Cải thiện hiệu năng:
Hiệu năng của DBMS phân tán được cải thiện dựa vào 2 điểm:
-
Có khả năng phân mảnh CSDL khái niệm. Ở đây có 2 ưu điểm
nổi bật:
Mỗi trạm chỉ xử lý 1 phần CSDL, tranh chấp về CPU và
dịch vụ xuất nhập không nghiêm trọng như các CSDL tập
trung
Cục bộ hoá dữ liệu, làm giảm thiểu các chậm trễ do truy
- Tính an ninh (security): So với CSDL tập trung, bảo mật của
CSDL phân tán khó khăn hơn nhiều.
Trang 14
III. GẮN BÓ THÔNG TIN TRONG HỆ
CSDL PHÂN TÁN
1. Giới thiệu vấn đề
2. Sự gắn bó thông tin
3. Triển khai giao dịch tôn trọng sự gắn bó
4. Thuật toán
Trang 15
1. Giới thiệu vấn đề:
Việc truy cập thông tin trong hệ tin học phân tán
không thể tiến hành theo một trình tự ngẫu nhiên.
Nguyên do cơ bản của vấn đề trên chính là vấn đề
bế tắc và gắn bó dữ liệu.
Hai hiện tượng trên có thể diễn ra bất cứ lúc nào và
bất cứ ở đâu trong hệ và gây nên những hậu quả có
tính chất kỹ thuật không thể lường trước được.
Trạng thái của hệ thoã mãn một tập các ràng buộc
toàn vẹn gọi là trạng thái gắn bó.
Trang 16
2. Sự gắn bó thông tin
GIẢ ĐỊNH THỰC TẾ
Số lượng các đối tượng thông tin
có thể truy cập được và số lượng
đặc tính này, cần phải lưu ý là trạng thái của hệ chỉ
được xác định ở mức quan sát cho trước.
2. Sự gắn bó thông tin (tt)
Trang 18
Trạng thái của hệ được xác định ở hai mức quan sát :
•
Người sử dụng: Tiến trình là thực hiện một dãy các giao
dịch. Giao dịch đó là chương trình duy nhất được thực hiện
từ một trạng thái gắn bó dẫn hệ đến một trạng thái gắn bó
khác
•
Hệ thống: Mỗi giao dịch được cấu tạo từ một dãy các tác
động được thể hiện như sau.
•
Nếu hai tác động A và B thuộc hai giao dịch khác nhau
được thực hiện bởi hai tiến trình thì hiệu ứng tổng quát
của chúng sẽ là hoặc hiệu ứng của dãy (A;B) hoặc là
(B;A)
2. Sự gắn bó thông tin (tt)
Trang 19
Ở mức hệ thống, các tác động là phần tử nhỏ nhất không thể
chia cắt được nữa. Trong quá trình thực hiện hệ phải đảm bảo
cho các tác động không bị ngắt quãng.
Cho một tập hợp giao dịch M={T
1
,T
2
…,T
, a
2
a
n
).
Tuân thủ trật tự nội tại từng giao dịch.
Gồm tất cả các tác động tạo nên các giao dịch M.
Mỗi tác động chỉ xuất hiện 1 và chỉ 1 lần.
⇒ S gọi là trật tự hoá của tập hợp các giao dịch M.
2. Sự gắn bó thông tin (tt)
Trang 21
3. Triển khai giao dịch tôn trọng sự gắn bó
Cho một tập hợp giao dịch M={T
1
,T
2
…,T
n
}.
Một trật tự hóa của tập hợp các tác động thành phần thực
hiện hoàn toàn các giao dịch.
Việc thu được một trật tự hóa gắn bó chỉ có thể thành công khi
áp dụng các ràng buộc trên trật tự thực hiện các tác động.
Nguyên lý của phương pháp là ở chỗ làm chậm một tác
động nào đó cho đến thời điểm mà sự thực hiện của nó không
khác nhau ở trên, để duy trì sự gắn bó trong môi trường phân tán
phải thực hiện:
Và đòi hỏi giao dịch phải có các đặc tính toàn vẹn:
1
Nếu một tiến trình bị sự cố trước khi kết thúc T nhưng lại sau các
thao tác thay đổi cần thiết của T, trạng thái của hệ là gắn bó.
2
Nếu một tiến trình bị sự cố trước khi diễn ra các thay đổi của T,
trạng thái của hệ là gắn bó.
3
Nếu một tiến trình bị sự cố giữa các thay đổi của T, trạng thái của
hệ là không gắn bó.
3. Triển khai giao dịch tôn trọng sự gắn bó (tt)
Trang 24
Quản lý gắn bó các giao dịch
Xét hệ có các đối tượng được phân tán trên nhiều trạm, nhưng
không có bản sao.
Các tác động được thực hiện trên các trạm khác nhau có thể
tiến hành theo kiểu song song.
Áp dụng cơ chế then cài có thể dẫn đến bế tắc và thiếu thốn
vô hạn. Nhưng thực tế khả năng bế tắc là không đáng kể vì
mỗi giao dịch chỉ xử lý tập hợp nhỏ của các đối tượng.
⇒ Đưa ra các phương pháp để quản lý gắn bó các giao dịch:
Phương pháp dự phòng (đòi hỏi phải có kiến thức cần thiết
về các đối tượng xử lý)
Phương pháp phát hiện động (hoàn hảo nếu khả năng xung