BÀI TẬP LỚN MÔN CƠ SỞ DỮ LIỆU PHÂN TÁN: Xây dựng hệ thống quản lý nhân khẩu. - Pdf 34

BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CNTT
------------

BÀI TẬP LỚN
MÔN: CƠ SỞ DỮ LIỆU PHÂN TÁN

ĐỀ TÀI: Xây dựng hệ thống quản lý nhân khẩu.
Sinh viên thực hiện: Hoàng Việt Đức.
Lớp: KTPM CLC - K7.
Giáo viên hướng dẫn: Th.s Trần Thanh Hùng.

Hà Nội ngày 22 tháng 12 năm 2015
Hcxjkzhvdxc
1


Mục lục
BỘ CÔNG THƯƠNG......................................................................................................................................1
Mục lục........................................................................................................................................................2
Lời nói đầu...................................................................................................................................................4

ngµy
20 th¸ng 05
CHƯƠNG 1. Tổng quan về cơ Hµ
sở dữNéi,
liệu phân
tán...................................................................................5
n¨m 2009


3


Lời nói đầu
Sự phát triển mạnh mẽ của dữ liệu ngày càng lớn, đòi hỏi các hệ thống cần phải áp
dụng các công nghệ mới. Hệ thống phân tán và cơ sở dữ liệu được phân tán ngày càng
được quan tâm và phát triển bởi lý do đó.
Để thể hiện được lợi ích cũng như cách xây dựng một hệ thống phân tán, chúng em đã
chọn đề tài “Xây dựng hệ thống quản lý nhân khẩu” để nghiên cứu và xây dựng.
Trong quá trình thực hiện còn nhiều thiếu xót, mong thầy và các bạn đóng góp ý kiến
để hệ thống hoàn thiện hơn.
Em xin chân thành cảm ơn!

4


CHƯƠNG 1. Tổng quan về cơ sở dữ liệu phân tán
1.1. Khái niệm
1.1.1. Định nghĩa cơ sở dữ liệu phân tán
Cơ sở dữ liệu phân tán là tập hợp dữ liệu mà về mặt logic thuộc về cùng một hệ thống
nhưng được trải rộng ở nhiều vị trí khác nhau trong một mạng máy tính.
Có 2 điểm quan trọng được nêu ra trong định nghĩa trên:
- Phân tán: dữ liệu không đặt trên cùng một vị trí, điều này giúp chúng ta có thể phân
biệt một CSDL phân tán với một CSDL tập trung, đơn lẻ.
- Tương quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau, điều
này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp CSDL cục bộ
hoặc các tệp cư trú tại các vị trí khác nhau trong một mạng máy tính

5



nhược điểm này giải pháp là chỉ có một bản sao duy nhất.
-

Giảm không gian lưu trữ. Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng cùng

truy cập đến một CSDL mà không cần đến nhiều bản sao ở những nơi chương trình ứng
dụng cần .
+ CSDL phân tán chia dữ liệu ra thành nhiều phần nhỏ và được thể hiện như một bản
sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu.
Cấu trúc vật lý và khả năng truy cập:
+ CSDL phân tán, hiệu quả của truy cập thể hiện ở thời gian tìm kiếm và chuyển dữ
liệu nhỏ nhất, chi phí truyền thông thấp nhất. Công việc viết ra cách thức truy cập CSDL
phân tán cũng giống như viết chương trình duyệt trong các CSDL tập trung.
Tính toàn vẹn, hồi phục và điều khiển tương tranh:
+ CSDL phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống
điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp. Như vậy giao tác

7


tự trị là phương tiện đạt được sự toàn vẹn trong CSDL Có hai mối nguy hiểm của giao tác
tự trị là lỗi và tương tranh.
Tính biệt lập và an toàn:
+ CSDL tập trung, người quản trị hệ thống có quyền điều khiển tập trung, người sử
dụng được phân quyền mới truy cập vào được dữ liệu. Trong cách tiếp cận CSDL tập
trung, không cần thủ tục điều khiển chuyên biệt.
+ CSDL phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề tương
tự như người quản trị CSDL truyền thống. Tuy nhiên, với cấp độ tự trị cao ở mỗi điểm,
người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của

khả năng tương thích cao.
-

Dữ liệu tại các vị trí khác nhau có thể có các định nghĩa và khuôn dạng chung.
Các hệ CSDL phân tán thuần nhất thể hiện một mục đích thiết kế đối với các

CSDL phân tán. Cụ thể, các CSDL phân tán thuần nhất được thiết kế bằng cách chia nhỏ
một CSDL xí nghiệp thành nhiều CSDL địa phương, các CSDL địa phương định vị trên
các trạm làm việc khác nhau nhưng chúng được biểu diễn bởi cùng một mô hình dữ liệu
và được quản trị bởi cùng một hệ quản trị CSDL địa phương.

Sơ đồ kiến trúc tham chiếu của hệ CSDL phân tán thuần nhất
- Sơ đồ quan niệm tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong CSDL
phân tán. Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của tập các quan hệ
tổng thể.
- Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên
nhau được gọi là đoạn. Sơ đồ tổng thể mô tả các ánh xạ giữa các quan hệ tổng thể và các
9


đoạn được định nghĩa trong sơ đồ phân đoạn. Ánh xạ này là một chiều. Có thể có nhiều
đoạn liên kết tới một quan hệ tổng thể, nhưng mỗi đoạn chỉ liên kết tới nhiều nhất là một
quan hệ tổng thể. Các đoạn được chỉ ra bằng tên của quan hệ tổng thể cùng với tên của
mục đoạn
- Sơ đồ sắp chỗ: các đoạn là các phần logic của quan hệ tổng thể được định vị vật lý
trên một hoặc nhiều vị trí trên mạng. Sơ đồ sắp chỗ định nghĩa đoạn nào định vị tại các vị
trí nào. Kiểu ánh xạ được định nghĩa trong sơ đồ sắp chỗ quyết định CSDL phân tán là dư
thừa hay không.
- Sơ đồ ánh xạ địa phương: ánh xạ các ảnh vật lý và các đối tượng được lưu trữ tại một
trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ảnh vật lý).

Các máy tính trong hệ thống phân tán đều có bộ xử lý và bộ nhớ riêng, nhờ vậy chúng
có thể xử lý công việc song song. Một công việc có thể được chia nhỏ và chuyển cho
từng máy xử lý đồng thời, giúp tăng tốc độ xử lý đối với những việc có lượng tính toán
lớn đòi hỏi nhiều thời gian. Kết quả cuối cùng được tổng hợp dựa trên kết quả xử lý ở
từng máy.
1.2.3. Tính trong suốt dữ liệu
1.2.3.1. Trong suốt phân tán
Cho phép xử lý dữ liệu trên CSDL phân tán giống như CSDL tập trung . Người sử
dụng không cần biết dữ liệu đã được phân đoạn như thế nào, các bản sao dữ liệu đặt ở
đâu, vị trí vật lý lưu trữ đặt như thế nào.
- Trong suốt địa điểm: Người dùng không cần biết vị trí vật lý của dữ liệu đặt ở đâu.
Trong truy vấn chỉ cần đưa ra tên đoạn mà không cần chỉ ra vị trí.
- Trong suốt tên: khi một đối tượng đã được đặt tên thì có thể truy nhập chính xác
không cần đặc tả thêm.
- Trong suốt bản sao: Sự nhân bản là quá trình sao chép và duy trì dữ liệu trong hệ
CSDL phân tán. Cùng một dữ liệu (được lưu trữ vật lý tại một vị trí) có thể sử dụng được
11


trên nhiều vị trí khác nhau. Các bản sao có thể được lưu trữ trên nhiều trạm làm tăng hiệu
suất, độ tin cậy và tính sẵn sàng của hệ thống. Các ứng dụng có thể truy nhập dữ liệu tại
các trạm mà không phải truy cập từ xa giảm tải trên trạm lớn. Hệ thống cho phép tiếp tục
thực hiện nếu như các trạm từ xa có sự cố. Trong suốt bản sao đảm bảo người dùng
không biết đó là các bản sao vì dữ liệu luôn được cập nhật và đồng bộ với dữ liệu gốc.
- Trong suốt phân đoạn: Một quan hệ trong CSDL phân tán có thể phân đoạn ngang
hoặc phân đoạn dọc nghĩa là tách thành các bộ dữ liệu hoặc các quan hệ con và lưu trữ
trên nhiều trạm khác nhau. Trong suốt phân đoạn cho phép người sử dụng không cần biết
có sự phân đoạn, các truy vấn dữ liệu vẫn được viết như CSDL tập trung.
1.2.3.2. Trong suốt giao dịch
CSDL phân tán cho phép một giao dịch có thể cập nhật, sửa đổi dữ liệu trên các trạm

là toán tử và các đoạn là kết quả. Hay nói cách khác, việc phân đoạn ngang bao gồm việc
chia các bộ của quan hệ thành các tập con. Mỗi tập con này có thuộc tính vị trí thông
thường. Các đoạn này được xác định qua việc coi mỗi đoạn là toán tử chọn trên quan hệ.
Phân đoạn dọc: phân đoạn dọc một quan hệ là việc chia nhỏ tập thuộc tính thành nhiều
nhóm quan hệ và đoạn dọc. Phân đoạn đúng khi mỗi thuộc tính đều ánh xạ ít nhất sang
một thuộc tính của đoạn. Hơn nữa, có thể tạo lại quan hệ ban đầu bằng liên kết các đoạn
với nhau.
Có một số luật để xác định các đoạn:
- Điều kiện hợp: mọi dữ liệu của quan hệ phải ánh xạ đến các đoạn. Không xảy ra
trường hợp dữ liệu thuộc về quan hệ nhưng không thuộc về một đoạn nào.
- Điều kiện tái tạo lại quan hệ: luôn luôn có khả năng tạo lại quan hệ từ các đoạn của
quan hệ. Điều kiện cần: mỗi đoạn được lưu trữ trong cơ sở dữ liệu phân tán và quan hệ
phải xây dựng lại được khi cần thiết.

13


- Điều kiện không liên kết: thích hợp khi các đoạn không liên kết với nhau vì vậy các
bản dữ liệu lặp lại có thể được điều khiển rõ ràng ở các mức cấp phát. Điều kiện này chủ
yếu có ích với phân đoạn ngang.
1.4. Ưu điểm, nhược điểm của hệ phân tán
1.4.1. Ưu điểm
-

Đáp ứng nhanh hầu hết các ứng dụng sử dụng dữ liệu tại các trạm

-

Tăng cường các đơn thể ứng dụng và CSDL mà không làm cản trở người sử
dụng hiện tại.



CHƯƠNG 2. Phân tích và thiết kế hệ thống quản lý nhân khẩu
1.5. Xác định tác nhân và ca sử dụng trong hệ thống

Tác nhân

Ca sử dụng

Mô tả

Quản trị

Quản lý nhân

Xem, thêm, sửa, xóa các thông tin về nhân

viên

khẩu

khẩu

1.6. Xác định các đối tượng của hệ thống
Dựa vào mô tả bài toán, ta xác định được các đối tượng chính của hệ thống như sau:
Đối tượng

Thuộc tính

Kiểu


nvarchar(50)

Thôn

homeTown

nvarchar(50)



accID

int

Mã tài khoản

Account

15


accName

nvarchar(50)

Tên người dùng

accPass


16


 Giao diện thêm mới nhân khẩu
 Giao diện cập nhật nhân khẩu

CHƯƠNG 3. Hệ thống quản lý nhân khẩu
1.9. Mô hình thiết kế phân tán

Máy Chủ

Máy Client

Máy Client

Xã Minh
Khai

Xã Phú
Diễn

Mô hình thiết kế phân tán

17


1.10. Hệ thống quản lý nhân khẩu
Quản lý nhân khẩu:

18


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status