1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Về cơ cấu tổ chức, tỉnh Quảng Bình có 159 đơn vị hành chính
cấp xã, 8 huyện, thành phố và 20 sở, ban ngành là các cơ quan hành
chính cấp tỉnh thuộc Ủy ban nhân dân tỉnh quản lý. Sở Nội vụ là cơ
quan chuyên môn, giúp Ủy ban nhân dân tỉnh quản lý cán bộ, công
chức, viên chức toàn tỉnh với 187 đầu mối các cơ quan, ban, ngành.
Việc quản lý nhân sự được bố trí phân tán theo tổ chức và phân cấp
quản lý đa tầng.
Hồ sơ cán bộ, công chức là tài liệu quan trọng có tính pháp lý
phản ánh trung thực về lý lịch của từng cá nhân cán bộ, công chức.
Trên thực tế, công tác quản lý hồ sơ cán bộ, công chức bằng
phương pháp truyền thống (hồ sơ giấy) nói chung và hồ sơ điện tử về
cán bộ, công chức nói riêng thời gian qua chưa được quan tâm, chỉ
đạo để thực hiện một cách đầy đủ và nghiêm túc. Do vậy, khi các cơ
quan Nhà nước có thẩm quyền yêu cầu số liệu để phục vụ cho việc
nghiên cứu hoạch định chính sách đối với đội ngũ cán bộ, công chức
hoặc ra quyết định về nhân sự thì các cơ quan chuyên môn không
cung cấp được hoặc nếu có thì bản thân số liệu đó lại lạc hậu và thiếu
chính xác, không đầy đủ và thường không kịp thời.
Từ thực tế nêu trên, để đáp ứng yêu cầu về tính kịp thời, nâng
cao chất lượng và hiệu quả công cụ quản lý cán bộ, công chức
chính quy và hiện đại, cần thiết xây dựng cơ sở dữ liệu thông tin
về cán bộ, công chức hành chính nhà nước của tỉnh. Vì vậy, đề tài
“Xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về
nhân sự tại Quảng Bình” được lựa chọn là hướng đi phù hợp với
hệ thống quản lý đa tầng, phức tạp, phải xử lý theo hướng phân
2
tán mới giải quyết được yêu cầu bài toán; đồng thời hỗ trợ thực
hiện cải cách hành chính, hướng tới chính quyền điện tử là vấn đề
nhanh về nhân sự tại Quảng Bình
6. Tổng quan tài liệu nghiên cứu
- Quy định hiện hiện hành của Nhà nước về quản lý cán bộ,
công chức, viên chức và tình hình thực tế của địa phương;
- Hệ tin học phân phân tán; nguyên lý hệ CSDL phân tán
- Ngôn ngữ lập trình Java và JSP
- Hệ quản trị cơ sở dữ liệu MySQL
CHƯƠNG 1
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
Hệ cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự
tại Quảng Bình là hệ thống hợp nhất quản lý từ cấp tỉnh đến tất cả
các xã trực thuộc huyện, do dó cơ sở dữ liệu phục vụ quản lý phải
hợp nhất và là tài nguyên dùng chung để khai thác hiệu quả về công
tác quản lý nhân sự.
Hệ thống có sự phân cấp khác nhau nhằm mục đích quản lý,
tra cứu, thống kê và cập nhật thông tin một cách nhanh chóng, hiệu
quả. Trên cơ sở đó, hệ quản lý phân cấp thành 3 cụm Server khác
nhau và phân tán trên phạm vi địa lý khác nhau. Cụm thứ nhất quản
lý nhân sự cấp sở, ban ngành tương đương trực thuộc tỉnh. Cụm thứ
hai quản lý nhân sự cấp huyện, chủ yếu quản lý nhân sự các phòng
trực thuộc huyện. Cụm thứ ba quản lý nhân sự cấp xã, công tác quản
lý tập trung là các cán bộ có chức danh thuộc xã.
Việc phân tán cơ sở dữ liệu và chương trình trên hệ thống 3
cụm Server khác nhau buộc phải có sự phân tích, thiết kế và vận
4
hành hệ đảm bảo tính hoạt động ổn định và gắn bó trên hệ. Bên cạnh
đó, công tác quản lý các luồng dữ liệu khai thác dùng chung là yếu tố
sống còn của hệ, như vậy ta có thể phân chia hệ thành hai thành phần
cơ bản là mạng máy tính và CSDL phân tán.
1.1. MẠNG MÁY TÍNH
- Sự tương quan logic: Các dữ liệu có một số tính chất ràng
buộc lẫn nhau.
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại
Quảng Bình có các đặc điểm về xử lý tại các cụm Server:
Cụm Server cấp xã: nhập liệu cán bộ, xử lý thông tin về cá
nhân, thống kê chuyển một phần thông tin về cán bộ mới cập nhật
lên cụm Server cấp huyện.
Cụm Server cấp huyện: nhập liệu cán bộ, xử lý thông tin về cá
nhân, thống kê chuyển một phần thông tin về cán bộ mới cập nhật
lên cụm Server cấp sở.
Cụm Server cấp sở, ban ngành và tương đương: nhập liệu cán
bộ, xử lý thông tin về cá nhân, thống kê thông tin về cán bộ, việc cập
nhật chỉ tiến hành cục bộ.
1.2.2. Hệ quản trị cơ sở dữ liệu phân tán (DDBMS)
Hệ quản trị cơ sở dữ liệu phân tán là hệ thống phần mềm cho
phép quản lý các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán
trở nên trong suốt đối với người sử dụng.
6
Các thành phần nhất thiết của DDBMS thông tin nhanh về
nhân sự tại Quảng
Bình:
- Quản trị dữ
liệu: QTDL
- Truyền
thông dữ liệu:
TTDL
- Từ điển dữ
liệu: TDDL dùng để
mô tả thông tin về
sự phân tán của dữ
- Các cấu trúc vật lý phức tạp giúp liên lạc dữ liệu trong cơ sở
dữ liệu phân tán.
- Tính toàn vẹn, phục hồi, đồng thời dựa vào giao dịch phân
tán.
Việc chọn lựa CSDL phân tán sẽ thích hợp đối với các ứng
dụng phát triển trong một hệ thống mạng diện rộng do cải tiến hiệu
năng, giảm tranh chấp và giảm chi phí truyền bằng cách phân mảnh
và phân tán dữ liệu hợp lý. Đối với trường hợp xây dựng hệ thống
phục vụ thông tin nhanh về nhân sự tại Quảng Bình, việc lựa chọn
CSDL phân mảnh dọc là bài toán tối ưu cho ứng dụng quản lý, tra
cứu và thống kê nhân sự tại tỉnh và đảm bảo hiệu năng khai thác sử
dụng và giảm chi phí truyền.
1.2.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán
Kiến trúc tham chiếu không được cài đặt rõ ràng trên tất
cả cơ sở dữ
liệu
phân tán, tuy nhiên các mức của nó được khái
quát chính xác, thích hợp để mô tả
tổ
chức chung cho mọi hệ cơ sở
dữ liệu phân tán
.
- Lược đồ toàn cục: Mô tả tổng thể và thống nhất chung nhất
của tất cả dữ liệu của cơ sở dữ liệu phân tán độc lập với môi trường
phân tán.
- Lược đồ phân mảnh: Mỗi quan hệ toàn cục có thể được chia
thành các thành phần không trùng nhau được gọi là các phân mảnh.
8
Lược đồ phân mảnh định nghĩa ánh xạ giữa các quan hệ toàn cục và
các phân mảnh.
1.3. CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN
1.3.1. Khái niệm tính trong suốt
1.3.2. Một số khía cạnh điển hình của tính trong suốt
1.4. PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU
1.4.1. Phân mảnh dữ liệu
a. Lý do phân mảnh
- Các ứng dụng chỉ yêu cầu thao tác trên các tập con của các
quan hệ, là khung nhìn dữ liệu của người sử dụng.
- Phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử
lý như một đơn vị dữ liệu cho phép thực hiện nhiều giao dịch đồng
thời. Phân mảnh các quan hệ cũng cho phép thực hiện song song một
câu truy vấn bằng cách chia nó thành một tập các câu truy vấn con
hoạt tác trên các mảnh. Vì thế việc phân mảnh sẽ làm tăng mức độ
hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống.
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại
Quảng Bình, dữ liệu được phân rã và phân tán trên 3 cụm Server
khác nhau và với mức độ yêu cầu tính chất về tra cứu, thống kê
thông tin đối với bài toán quản lý nhân sự được đặt ra tại tỉnh thì hệ
thống phân mảnh dọc là thích hợp nhất với điều kiện hiện nay. Với
nhu cầu phát triển thì hệ thống có thể sử dụng phương pháp phân
mảnh lai sẽ mang lại hiệu quả cao hơn trong việc xây dựng ứng dụng
và CSDL phân tán. Giải pháp của bài toán là lựa chọn phân mảnh
dọc, do đó các phương pháp phân tích, thiết kế tập trung vào phân
mảnh này sẽ được trình bày trong Chương 2.
10
b. Các quy tắc phân mảnh
Các nguyên tắc để đảm bảo cơ sở dữ liệu khi phân mảnh sẽ
đảm bảo tính không thay đổi về ngữ nghĩa. Ba qui tắc phải tuân thủ
khi phân mảnh cơ sở dữ liệu quan hệ:
Tính đầy đủ
, i =
1, ,n và mục dữ liệu dj nằm trong một mảnh R
j
thì nó sẽ không nằm
trong mảnh R
k
, (k≠j).
c. Mức độ phân mảnh
d. Các phương pháp phân mảnh
Phân mảnh ngang
Phân mảnh dọc
Phân mảnh dọc quan hệ R sinh ra các mảnh R
1
, R
2
, , R
r
, sao
cho mỗi mảnh chứa một tập con các thuộc tính của quan hệ R và
khoá của nó. Mục đích của phân mảnh dọc là phân chia quan hệ R
thành tập các quan hệ nhỏ hơn để nhiều ứng dụng có thể chỉ cần thực
hiện trên một mảnh. Mảnh tối ưu là mảnh sinh ra một lược đồ phân
mảnh cho phép giảm tối thiểu thời gian thực hiện của ứng dụng trên
mảnh đó.
11
Để có được các lời giải tối ưu cho bài toán phân mảnh dọc,
phải sử dụng hai phương pháp khám phá (Heuristic) cho phân mảnh
dọc các quan hệ toàn cục:
(1). Nhóm thuộc tính: bắt đầu gán mỗi thuộc tính cho một
mảnh và trong mỗi bước, nối một số mảnh lại với nhau cho đến khi
Các đối tượng tham gia sử dụng gồm: Sở Nội vụ; Các sở, ban,
ngành thuộc Ủy ban nhân dân tỉnh; Phòng Nội vụ các huyện, thành
phố; Ủy ban nhân dân cấp xã.
CSDL phân tán về nhân sự tỉnh Quảng Bình được sử dụng
trong khối cơ quan hành chính nhà nước. Hồ sơ cán bộ, công chức
mỗi cơ quan, đơn vị là một cơ sở dữ liệu cục bộ.
Mỗi cơ quan (các sở, ngành, UBND cấp huyện) có quyền truy
vấn thông tin của toàn bộ cán bộ, công chức của đơn vị mình; đồng
Cấp
huyện:
08 UBND
huyện, Thành phố
Cấp
tỉnh:
20
sở, ban,
ngành
Tỉnh Quảng
Bình
Cấp xã:
159 UBND
xã, phường, thị trấn
13
thời các cơ quan chuyên môn cấp trên có thể truy vấn (xem) một số
thông tin của nhân sự cùng chuyên ngành dọc theo phân cấp quản lý:
- Các sở: Truy vấn cập nhật thông tin của cơ quan mình; xem
được thông tin của nhân sự cùng chuyên ngành quản lý từ tỉnh đến
xã.
- Các huyện: Truy vấn cập nhật thông tin của toàn huyện (bao
gồm cả của các xã); xem thông tin của toàn huyện mình.
Ghi
chú
Phòng trực
thuộc sở, ban
ngành tương
đương
S H X P 01 0 00 07 7
H=0 &
X=00
Phòng trực S H X P 00 3 00 12 7 S=0 &
14
thuộc huyện X=00
15
Bảng 2.8. Dạng mã hóa chức danh cán bộ, công chức cấp xã
Cấp độ
mã hóa
Dạng ký tự Dạng mã
Số
lượng
Ghi
chú
Chức danh cán
bộ, công chức
cấp xã
S H X P CD 00 2 05 00 05
9
S=00
&
P=00
Bảng 2.10. Dạng mã hóa nhân sự
hệ thống dựa trên kết nối mạng WAN và giao thức TCP nhằm đảm
bảo kết nối giữa các cụm; bên cạnh đó, để dễ dàng đối với người
dùng trên các thiết bị đầu cuối, công nghệ sử dụng là công nghệ
Web.
Hình 2.2. Mô hình phân cấp quản lý
17
2.2.2. Phân mảnh dữ liệu
2.2.3. Cấp phát
2.2.4. Xác định vị trí đặt CSDL và phân nhóm người dùng
Trên cơ sở các tiêu chuẩn đã nêu và tính chất của hệ thống
thông tin quản lý, mô hình cấp phát dữ liệu phân tán theo hai nhóm
chính như sau:
Cơ sở dữ liệu địa phương (Cụm server 1): là nhóm cập nhật
thông tin vào cơ sở dữ liệu, đặt tại vị trí nhóm làm việc.
Cơ sở dữ liệu truy xuất từ xa (Cụm server 2, Cụm server 3):
Đặt tại các phân cụm khác nhau. Nếu có một yêu cầu cấp phát tài
nguyên, ngoài truy xuất cục bộ, các yêu cầu này được gửi đến CSDL
từ xa sau đó nhận các hồi đáp và tái cấu trúc mảnh.
Sơ đồ kết nối thông tin giữa các cụm cơ sở dữ liệu theo mô tả
ở Hình 2.6.
Hình 2.6. Mô hình cấp phát dữ liệu phân tán
18
19
2.3. XỬ LÝ TRUY VẤN TRONG CSDL PHÂN TÁN
2.3.1. Khái niệm truy vấn
Truy vấn là một biểu thức được biểu diễn bằng một ngôn ngữ
thích hợp và dùng để xác định một phần dữ liệu được chứa trong cơ
sở dữ liệu.
Truy vấn phân tán là một chuỗi các thao tác dữ liệu được thực
hiện trên các mảnh quan hệ phân rã.
2.4.2. Kiểm soát toàn vẹn ngữ nghĩa phân tán
a. Định nghĩa các phán đoán toàn vẹn phân tán
b. Cưỡng chế thi hành các phán đoán toàn vẹn phân tán
2.4.3. So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung
và phân tán
21
CHƯƠNG 3
XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ
THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH
2.1. MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG
2.1.1. Biểu đồ phân cấp chức năng
Hình 3.1.
Biểu đồ phân cấp chức năng
Biểu đồ phân cấp chức năng về CSDL theo mô tả trong Hình
3.1 thể hiện quá trình tác động của người dùng lên CSDL với các
chức năng cơ bản như: cập nhật CSDL, tìm kiếm, thống kê, …
2.1.2. Biểu đồ luồng dữ liệu
Hình 3.2. Biểu đồ luồng dữ liệu
mức ngữ cảnh
Quản lý
nhân sự
22
Hình 3.3. Biểu đồ luồng dữ liệu mức đỉnh
2.2. TỐI ƯU HÓA TRUY VẤN PHÂN TÁN
2.2.1. Hàm chi phí
2.2.2. Số liệu thống kê cơ sở dữ liệu
2.3. Lực lượng của các kết quả trung gian
2.3. THUẬT TOÁN TỐI ƯU HÓA TRUY VẤN PHÂN TÁN
SYSTEM R*
2.4. ĐIỀU KHIỂN ĐỒNG THỜI PHÂN TÁN
2.5. KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG
2.5.1. Kiến trúc chương trình
Trong hệ thống chương trình phân chia thành 3 cụm quản lý
khác nhau: cụm sở, ban ngành tương đương; cụm huyện và cụm xã.
Kiến trúc chương trình thể hiện qua Hình 3.10, các thành phần
nằm trong thể hiện các chức năng phục vụ ở đầu cuối đối với người
sử dụng. Thành phần nằm trong là hệ thống giám sát, ở đây hệ
thống mới chỉ phát triển ở mức giám sát CSDL để đảm bảo tính gắn
bó và tính trong suốt của hệ phân tán như đã đề cập ở chương 1.
Thành phần quan trọng nhất nằm trong , tại đây các vấn đề phân
tích, thiết kế và triển khai hệ tổng hợp tất cả các nguyên lý và các
thuật toán đã được mô tả trong chương 1 và 2 được áp dụng để xây
24
dựng hệ; các vấn đề về phân tán CSDL và chương trình mà người
dùng không nhìn thấy được.
Theo Hình 3.10 chức năng người sử dụng bao gồm cập
nhật, tìm kiếm và thống kê nhân sự phục vụ công tác thông tin
nhanh. Đối với hệ thống người sử dụng ở , chức năng lấy
thông tin cung cấp dịch vụ,
để lấy các thông tin cơ bản và cần thiết
để cung cấp cho người sử dụng theo mô tả phân tán dữ liệu trên các
cụm Server.
Việc phân tán dữ liệu và cập nhật mảnh thể hiện qua
Hình 3.11, CSDLPT trên cụm
3 đặc trưng cho dữ liệu ở cấp
xã, tương ứng cụm 2 cấp
huyện và cụm 1 cấp sở, ban
ngành tương đương. Một dữ
liệu ở cụm 3 được chèn vào
cụm 3 ngay lập tức sẽ cập nhật
giải pháp tổng quát và cơ sở dữ liệu phân tán phục vụ công
tác quản lý hồ sơ cán bộ công chức, viên chức tỉnh Quảng
Bình, giải quyết vấn đề bất cập, thiếu khoa học trong công
tác quản lý hồ sơ cán bộ trong ngành Nội vụ nói chung và
của tỉnh Quảng Bình nói riêng, góp phần nâng cao chất
lượng và hiệu quả công tác quản lý cán bộ viên chức, công
chức chính quy và hiện đại; khắc phục những hạn chế, bất
cập trong công tác quản lý hồ sơ hiện nay trong các cơ quan
hành chính nhà nước tỉnh Quảng Bình.
3) Nghiên cứu, phân tích và thiết kế cơ sở dữ liệu phân tán, tập
trung vào giải pháp phân mảnh dọc, các chi phí, tối ưu hóa
trong hệ thống đồng thời đảm bảo tính trong suốt mà một hệ
cơ sở dữ liệu phân tán phải đạt được.