Chương 4 Cơ sở dữ liệu phân tán trong bài toán WSC - Pdf 62

VieBooks
Chơng 4: Cơ Sở Dữ Liệu Phân Tán trong bài toán Wsc
I/Giới thiệu khái quát về hệ thống và các vấn đề liên quan đến hệ thống:
1/Mô hình tổ chức và mô hình mạng của Công ty cấp nớc thành phố Hồ Chí Minh
(WSC):
WSC là cơ quan đã có nhiều năm ứng dụng máy tính trong sản xuất và quản lý kinh
doanh. Từ trớc năm 1997 WSC đã sử dụng hệ máy tính IBM sau đó là các chơng trình viết bằng FoxBase
và FoxPro để quản lý và tính hoá đơn tiền nớc.Đến năm 1997 WSC đợc trang bị một hệ thống mạng máy
tính hiện đại đòi hỏi một hệ thống phần mềm mới, ứng dụng công nghệ hiện dại, có khả năng kết nối diện
rộng, quản lý lợng khách hàng lớn và đáp ứng yêu cầu nghiệp vụ là:
-Đáp ứng 142 yêu cầu do các chuyên gia t vấn nớc ngoài đa ra bao trùm lên
các lĩnh vực chính:
Khách hàng.
Yêu cầu và khiếu nại của khách hàng.
Đồng hồ vật t, thiết bị và các vị trí lắp đặt đồng hồ.
Biểu giá tiền nớc và tiền phụ thu.
Chỉ số đồng hồ và xử lý hoá đơn tiền nớc.
Thu tiền.
Thởng phạt khách hàng.
Phiếu công tác, thi công và nhân sự
-Đáp ứng yêu cầu nghiệp vụ hiện tại.
a.Tổ chức công ty: Thể hiện qua sơ đồ:

Công ty cấp nước
WSC
Hoá đơn
Chi nhánh
Sài Gòn
Chi nhánh
Chợ Lớn
Chi nhánh

-Hệ quản lý khách hàng.
-Hệ xử lý hoá đơn và thu tiền.
-Hệ tổng hợp và phân tích thông tin.
-Hệ quản trị.
Bao gồm hơn 120 module chơng trình, 70 module làm báo cáo, 30 database triggers,
105 thực thể, 83 thủ tục và hàm. Số bản ghi hệ thống phải lu khoảng 35 000 000 bản ghi.
II.Các mô hình phân tán dữ liệu có thể áp dụng cho bài toán:
Có hai vấn đề đợc đợc đề cập trong khái niệm phân tán đó là:
+ Xử lý phân tán:
+ Dữ liệu phân tán:
Trong phạm vi của luận văn này sẽ trình bày các vấn đề liên quan đến phân tán dữ liệu. Mục đích
chính là đa ra đợc các giải pháp phân tán dữ liệu hiệu quả nhất cho từng ứng dụng cụ thể trong thực tế.
Dựa vào các phơng pháp thiết kế phân đoạn CSDL ngời ta tiến hành phân tán dữ liệu theo nhiều
cách khác nhau, trong đó có ba phơng pháp chính thờng đợc sử dụng là:
+ Phân tán dữ liệu hoàn toàn.
+ Phơng pháp phân tán partition.
+ Phơng pháp phân tán sử dụng replication.
1. Phân tán dữ liệu hoàn toàn.
a. Định nghĩa:
Là phơng pháp thực hiện phân chia bảng dữ liệu của quan hệ tổng thể thành các phần hoàn toàn
độc lập với nhau, sau đó định vị chúng vào các vị trí thích hợp theo các ứng dụng và yêu cầu thực tế.
b. Mô hình phân tán dữ liệu hoàn toàn:
Vị trí 1
Vị trí 2
Vị trí ...
CSDL 1
CSDL 2
CSDL ...
database link
database linkdatabase link

Mô hình phân tán dữ liệu của Công ty ABC:
Chi nhánh 1
Chi nhánh 2
Chi nhánh 3
CSDL 1
CSDL 2
CSDL 3
database link
database linkdatabase link

CSDL 1: Các thông tin về mặt hàng Xi măng, Sắt, Thép.
CSDL 2: Các thông tin về mặt hàng Trang trí nội thất.
CSDL 3: Các thông tin về mặt hàng Đồ điện gia dụng.
c. Các u điểm của phơng pháp phân tán dữ liệu hoàn toàn:
+ Xây dựng CSDL và các ứng dụng đơn giản.
+ Giảm mức độ d thừa d liệu.
+ CSDL thờng đợc truyền qua đờng truyền trực tiếp nên an toàn dữ liệu cao, tốc độ truyền lớn và ít
xảy ra lỗi đờng truyền.
d. Các nhợc điểm của phơng pháp phân tán dữ liệu hoàn toàn:
+ Giá thành đầu t cho các trang thiết bị lớn: Vì giải pháp tốt nhất là phải có hệ thống mạng cục bộ
với đờng truyền tốt. Tuy nhiên cũng có thể truyền dữ liệu qua đờng điện thoại trong trờng hợp cần thiết.
+ Phạm vi phân tán hạn chế.
e. Các ứng dụng phù hợp:
3
3
VieBooks
+ Các ứng dụng có CSDL nhỏ và vừa.
+ CSDL tự nó đã có sự phân chia thành các phần độc lập.
+ Nơi sử dụng các ứng dụng này phải có đờng truyền tốt.
2. Phơng pháp phân tán Partition.

Thực trạng của Công ty WSC:
WSC có 4 chi nhánh ( Sài Gòn, Gia Định, Thủ Đức, Chợ Lớn) đợc phân bố trên phạm vi rộng. Mỗi
chi nhánh đều có nhiệm vụ quản lý Khách hàng trong khu vực của chi nhánh:
+ Chi nhánh Sài Gòn: Quản lý Khách hàng trong khu vực Sài Gòn.
+ Chi nhánh Gia Định: Quản lý Khách hàng trong khu vực Gia Định.
+ Chi nhánh Thủ Đức: Quản lý Khách hàng trong khu vực Thủ Đức.
+ Chi nhánh Chợ Lớn: Quản lý Khách hàng trong khu vực Chợ Lớn.
Ngoài ra Công ty WCA còn có một hệ thống mạng tơng đối hiện đại.
4
4
VieBooks
Phân tích các đặc điểm dữ liệu về Khách hàng:
Công ty WCA phải quản lý một lợng Khách Hàng lớn trên diện rộng. Nh vậy để tạo ra các điều
kiện thuận lợi trong công tác quản lý thì ngoài giải pháp phân vùng chắc chắn không còn giải pháp nào
khác.
Lựa chọn giải pháp phân tán dữ liệu:
+ Chọn phơng pháp phân tán hoàn toàn: Dữ liệu về Khách Hàng tập chung ở một chi nhánh là
không thể phù hợp cho công tác quản lý gây khó khăn không những cho Công ty mà còn cho cả Khách
Hàng vì khoảng cách quá xa. Mặt khác nó làm ảnh hởng đến các ứng dụng khác ( tính hoá đơn ... ) của toàn
bộ hệ thống vì những ứng dụng đó cũng cần có các thông tin chính xác về Khách Hàng. Và còn rất nhiều
các khó khăn khác nếu dữ liệu đợc phân tán theo phơng pháp hoàn toàn.
+ Chọn phơng pháp phân tán sử dụng các replication: Chỉ trung tâm mới đợc cập nhật trực tiếp vào
CSDL còn các chi nhánh chỉ đợc tra cứu CSDL qua các Snapshot. Nh vậy các chi nhánh không thực hiện
một thao tác nào đối với CSDL, quá trình xử lý đều tập chung ở trung tâm. Nh vậy giải pháp này cũng sẽ
gặp phải những khó khăn tơng tự nh giải pháp phân tán hoàn toàn.
+ Chọn phơng pháp phân tán Partition: Đây chính là giải pháp phù hợp cho bài toán này, các
Khách Hàng sẽ đợc quản lý trực tiếp tại chi nhánh thuộc chính khu vực của Khách Hàng ( Khách Hàng ở
Sài Gòn, Gia Định, Chợ Lớn, Thủ Đức sẽ do các chi nhánh tơng ứng Sài Gòn, Gia Định, Chợ Lớn, Thủ Đức
quản lý), các ứng dụng khác nh tính hoá đơn cũng đợc thực hiện tơng ứng với từng Khách Hàng trong khu
vực. Trung tâm là nơi lu trữ các dữ liệu của riêng nó và ảnh dữ liệu (Snapshot) của tất cả các vị trí phục vụ

làm tươi
Replicate2
...Replicate3
Dữ liệu đợc copy về tuỳ theo yêu cầu và mục đích của ngời sử dụng cần tra cứu nh thế nào, cho
nên tại các vị trí khác nhau có thể có nhiều các bản sao dữ liệu trùng lặp. Tuy nhiên cần nhấn mạnh rằng dữ
liệu ảnh đợc tạo ra từ phơng pháp này chỉ tra cứu mà không cập nhật đợc.
Vì yêu cầu và mục đích của ngời sử dụng tơng đối đa dạng cho nên phơng pháp phân tán sử dụng
các Replication sử dụng kết hợp tất cả các kỹ thuật phân đoạn (ảnh) CSDL: Phân đoạn ngang, phân đoạn
dọc và phân đoạn hỗn hợp.
Dữ liệu thờng đợc truyền qua đờng điện thoại.
Ví dụ: CSDL về Văn Bản Pháp Quy của Văn phòng Chính Phủ.
CSDL về Văn Bản Pháp Quy có đặc điểm là các thao tác làm thay đổi CSDL chỉ đợc thực hiện tại
Văn phòng Chính Phủ nhng đợc tra cứu bởi tất cả các Tỉnh, Thành Phố trong cả nớc.
Dựa trên đặc điểm nh trên của CSDL, nếu sử dụng hai phơng pháp phân tán dữ liệu: Hoàn toàn và
Partition là không hợp lệ cả về chuyên môn và tính chất kinh tế của ứng dụng.
Vậy giải pháp thích hợp cho CSDL này là sử dụng Replication.
c. Các u điểm của phơng pháp phân tán sử dụng các Replication:
+ Dễ xây dựng CSDL cũng nh các chơng trình ứng dụng.
+ Truy nhập nhanh, vì thời gian truyền thông tin trên mạng giảm.
+ Có thể sử dụng đờng điện thoại để truyền dữ liệu đi xa.
+ Mỗi vị trí đều có thể sử dụng toàn bộ dữ liệu của CSDL.
d. Các nhợc điểm của phơng pháp phân tán sử dụng các Replication:
+ Mức độ d thừa dữ liệu cao.
+ Tăng thời gian truy nhập dữ liệu cục bộ, vì phải truy nhập trên một CSDL lớn.
e. Các ứng dụng phù hợp:
+ Các CSDL không quá lớn nhng phạm vi địa lý ứng dụng rộng.III/Mô hình phân tán dữ liệu tại WSC.
1/Phân tán chức năng hoạt động giữa trung tâm và chi nhánh tại WSC:


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status