TRIỂN KHAI CÔNG CỤ HỖ TRỢ XÂY DỰNG VÀ QUẢN TRỊ KHO DỮ LIỆU PHỤC VỤ QUẢN LÝ ĐÀO TẠO TẠI TRƯỜNG ĐẠI HỌC KINH TẾ - Pdf 48

TRIỂN KHAI CÔNG CỤ HỖ TRỢ XÂY DỰNG VÀ QUẢN TRỊ KHO DỮ LIỆU
PHỤC VỤ QUẢN LÝ ĐÀO TẠO TẠI TRƯỜNG ĐẠI HỌC KINH TẾ.
Ths.Nguyễn Văn Chức

4.1. Phân tích chức năng quản trị kho dữ liệu phục vụ đào tạo
Mục đích chính của kho dữ liệu đào tạo là hỗ trợ thông tin phục vụ công tác quản lý đào
tạo tại trường. Mỗi khoa, mỗi phòng đều có nhu cầu sử dụng thông tin riêng cho yêu cầu
tác nghiệp của mình. Vì vậy việc tổ chức, phân phát dữ liệu cho các đơn vị một cách hợp lý
và tổng hợp dữ liệu từ các đơn vị để lưu trữ, báo cáo, dự phòng là rất cần thiết.
Chức năng chính của kho dữ liệu phục vụ đào tạo gồm các chức năng sau:
Xây dựng các Data Mart cục bộ độc lập của các khoa, phòng: Lưu dữ liệu cục bộ tại
mỗi khoa, phòng. Các thông tin này sẽ được qui về một định dạng thống nhất đó là sử dụng
hệ quản trị CSDL ORACLE để tổ chức lưu trữ. Vì vậy nhiệm cụ chính là xây dựng cấu trúc
CSDL trong ORACLR hợp lý cho phép chuyển đổi dữ liệu từ các nguồn đã tồn tại trước
đây như MS Excel, MS Access, MS SQL SERVER về lưu trữ trong ORACLE. Như đã
phân tích trong chương 3 thì các DM cần xây dựng là DM_DAOTAO chứa dữ liệu trực
tiếp đến công tác đào tạo, DM_HOSOCB chứa dữ liệu liên quan đến hồ sơ cán bộ,
DM_HOSOSV chứa dữ liệu liên quan đến hồ sơ sinh viên và DM_VBNCKH chứa thông
tin liên quan đến công tác quản lý văn bằng và hoạt động nghiên cứu khoa học trong
trường.
Xây dựng công cụ tích hợp các DM đã xây dựng để trao đổi thông tin với nhau: Sau
khi xây dựng các Data Mart để lưu trữ dữ liệu phục vụ trực tiếp cho hoạt động tác nghiệp
của các đơn vị, phòng ban, công việc tiếp theo là xây dựng các công cụ cho phép tổng hợp,
chuyển đổi, đồng bộ, làm sạch dữ liệu, phân tán dữ liệu giữa các Data Mart vào một kho
dữ liệu chung cũng như phân phát dữ liệu cho người sử dụng phục vụ công tác quản lý.
Một số chức năng cần thiết cho công tác đào tạo như: Chuyển điểm từ khoa lên phòng đào
tạo, đối chiếu điểm giữa khoa và phòng đào tạo, cập nhật thông tin về sinh viên, chương
trình học, phân tán dữ liệu từ kho dữ liệu chung của trường xuống các khoa, phòng ban
như chuyển thông tin về sinh viên, môn học, cán bộ xuống kho dữ liệu cục bộ các khoa,
phòng, tìm kiếm dữ liệu cần thiết phục vụ công tác quản lý.
1

từ tổng kho dữ
liệu của trường
đến các khoa,
phòng ban phục
vụ công tác quản
lý, tác nghiệp

Hình 4.1. Sơ đồ phân cấp chức năng hệ thống quản lý kho dữ liệu phục vụ đào tạo
(1) Các kho dữ liệu cục bộ được tạo mới trên DBMS ORACLE để lưu trữ dữ liệu phục vụ
trực tiếp cho hoạt động của các khoa, phòng ban. Mỗi khoa, phòng ban có quyền tự trị cao
đối với các dữ liệu cục bộ của mình. Dữ liệu trong các DM có thể kế thừa từ các nguồn dữ
liệu đã tồn tại trước đó trong hệ thống ở nhiều định dạng dữ liệu như Excel, MS Access,
SQL SERVER hay Oracle vì vậy hệ thống quản trị dữ liệu hỗ trợ chuyển đổi tất cả các định
dạng dữ liệu về Oracle
(2) Dữ liệu trong các DM do những người quản trị cục bộ có toàn quyền cập nhật, khai
thác.Dữ liệu trong các DM được tích hợp về lưu trữ kho dữ liệu chung của trường để phục
vụ công tác tổng hợp, lưu trữ, khai thác phục vụ quản lý, điều hành. Cấu trúc của tổng kho
cũng được xây dựng trên DBMS Oracle. Tổng kho dữ liệu phải có người quản trị riêng và
đây là người có quyền cao nhất đối với hệ thống quản lý kho dữ liệu
(3) Trong quá trình hoạt động tác nghiệp, dữ liệu có sự biến đổi(do các thao tác cập nhật)
trong các DM hay trong tổng kho, vì vậy công tác đồng bộ nhằm giúp cho dữ liệu giữa các
2


nguồn có sự nhất quán cao, tránh xung đột dữ liệu giữa các nguồn dữ liệu. Chẳng hạn, sau
khi văn thư các khoa nhập điểm cho sinh viên ta tiến hành đồng bộ điểm lên phòng đào tạo
để cập nhật điểm cũng như công tác đối chiếu điểm sinh viên giữa khoa và phòng đào tạo.
(4) Dữ liệu từ tổng kho khi cần thiết sẽ được phân tán đến các đơn vị cần sử dụng như các
khoa, các phòng ban. Việc phân tán dữ liệu có thể phân tán ngang(theo số bản ghi) hay
phân tán dọc(theo số thuộc tính) cũng như phân tán theo một số điều kiện lọc. Ví dụ sau

dễ dàng và hiệu quả thông qua từ khóa, hỗ trợ kỹ thuật Email Alert giúp giám sát hiệu quả
và phản ứng kịp thời, khóa các ứng dụng tự động download của các Java applets và các
điều khiển ActiveX
VPN (Virtual Private Network):
VPN server tích hợp sẵn giúp người dùng từ xa có thể kết nối với mạng cục bộ của bạn để
check mail, load file, in ấn… một cách bảo mật với IPSEC, PPTP, L2TP, protocol, chế độ
mã hóa AES,MPPE, hardware-base DES/3DES thông qua mạng Internet.Tính năng độc
đáo này giúp tiết kiệm chi phí thuê bao đường leaseline hay cước viễn thông liên tỉnh/quốc
tế khi kết nối bằng quay số truyền thống, tích hợp sẵn DHCP server nhằm đơn giản hóa
việc cấu hình mạng nội bộ, bảo mật đơn giản và thuận tiện thông qua việc phân chia
VLAN, quản lý băng thông trên từng port (inbound / outbound).
Vùng này yêu cầu thiết bị Router (bộ định tuyến) và Firewall (tường lửa). Hiện nay trên thị
trường có nhiều hãng chuyên thiết bị mạng như Cisco, Draytek. Tuỳ thuộc vào kinh phí có
thể chọn loại thích hợp.
Vùng 2 (DMZ)
Vùng này bao gồm các server chức năng, bao gồm các server Database, DNS, DHCP, Mail,
Web, Backup,… dùng chung dữ liệu. Ở đây yêu cầu hệ thống phải đảm bảo kết nối liên tục,
sử dụng switch (Layer 3) tốc độ cổng mạng đạt đến mức Gigabit , có hỗ trợ VLAN nhằm
cho phép các truy cập nhanh .
Vùng 3 (back-end)
Vùng này chứa các server của các khoa để chứa dữ liệu nội bộ và riêng biệt, có thể dùng
switch có hỗ trợ VLAN để các máy trạm tại các nơi không thể nhìn thấy nhau.

4


4.3.Khả năng quản trị kho dữ liệu phân tán trong ORACLE
Hệ quản trị CSDL ORACLE là hệ thống quản trị dữ liệu lớn, hỗ trợ rất mạnh cho khả năng
quản lý kho dữ liệu(Data Warehouse), cơ sở dữ liệu phân tán trên các hệ thống thông tin
lớn. Sức mạnh vượt trội của ORACLE 9i là khả năng phân tích kho dữ liệu, truy xuất dữ

KHOA.DHKT.EDU.VN ta làm như sau:

4.3.2.Tạo các liên kết cơ sở dữ liệu(Database links) trong hệ thống CSDL phân tán
Để hỗ trợ cho các ứng dụng truy xuất dữ liệu trong hệ thống CSDL phân tán ta cần tạo các
liên kết dữ liệu(Database links) giữa các nguồn dữ liệu ở xa(Remote Database). Một
Database link là một con trỏ trên CSDL cục bộ(local database) cho phép bạn truy cập các
6


đối tượng dữ liệu trên một CSDL ở xa(remote database). ORACLE cho phép tạo các
Database Links bằng câu lẹnh SQL và bằng giao diện đồ họa.
Tạo các Database Links sử dụng câu lệnh SQL:
Database Link Private
CREATE DATABASE LINK "DAOTAO.DHKT.EDU.VN"
CONNECT TO "CHUC"
IDENTIFIED BY "chuc"
USING 'DMDAOTAO'
Database Link Public
CREATE PUBLIC DATABASE LINK "DAOTAO.DHKT.EDU.VN"
CONNECT TO "CHUC"
IDENTIFIED BY "chuc"
USING 'DMDAOTAO'
Tạo Database Link sử dụng giao diện đồ họa trong Oracle

Tạo Database Link thành công cho phép truy xuất đến CSDL đào tạo

7


Sau khi thiết lập Database Link thành công, ta có thể truy xuất dữ liệu từ xa thông qua tên

Sử dụng khung nhìn(View) để tạo trong suốt vị trí
Những View cục bộ có thể cung cấp mức trong suốt vị trí đối với CSDL cục bộ hoặc
CSDL từ xa trong CSDL phân tán.
Giả sử có bảng KHOA trong CSDL cục bộ DMDAOTAO và bảng GIANGVIEN trong
CSDL từ xa qua DB_link có tên TKTH.DHKT.EDU.VN, ta có thể tạo một khung nhìn nối
thông tin từ các CSDL cục bộ và từ xa như sau:

9


Khi người dùng sử dụng view V1 để xem dữ liệu, người sử dụng không cần biết dữ liệu
được lưu trữ vật lý ở đâu và được lấy từ bao nhiêu bảng.
Sử dụng bí danh(Synonym) để tạo trong suốt vị trí
Bí danh rất hữu ích trong cả hai môi trường CSDL phân tán và tập trung, sử dụng bí danh
là bạn đặt tên lại cho đối tượng CSDL để sử dụng, với CSDL phân tán bí danh làm cho
người sử dụng không quan tâm đến dữ liệu đang ở đâu trong hệ phân tán mà chỉ biết tên bí
danh của đối tượng CSDL. Một điều cần chú ý khi dùng bí danh là nếu đối tượng CSDL bị
di chuyên hoặc đổi tên thì ta phải thay đổi bí danh cho phù hợp.
Ta có thể tạo bí danh trên các đối tượng dữ liệu sau:
Tables, Views, Materialized Views, Procedures, Functions, Packages
Cú pháp để tạo bí danh:
CREATE [PUBLIC] synonym_name
FOR [schema.] object_name[@Database_link_name]
Trong đó:
public:Từ khóa xác định rằng bí danh có thể sử dụng cho mọi người dùng, nếu không có từ
khóa PUBLIC thì câu lệnh trên sẻ tạo ra bí danh riêng(Private) chỉ được sử dụng cho người
ta ra bí danh
synonym_name: tên bí danh dùng để tham chiếu đến đối tượng CSDL
schema: Lược đồ nơi chứa đối tượng CSDL
object_name: tên đối tượng CSDL được tham chiếu ví dụ như table, view, procedure,…

END;
Sau đó đăng nhập vào CSDL ở xa TKTH.DHKT.EDU.VN và tạo thủ tục DEL_MONHOC
CONNECT chuc/
CREATE PROCEDURE DEL_MONHOC(S CHAR) AS
BEGIN
DELETE FROM MONHOC
12


WHERE MAMH=S;
END;
Khi người dùng hoặc ứng dụng đăng nhập vào CSDL DMDAOTAO cục bộ gọi thủ tục
DEL_RM(2150112) thủ tục này gọi thủ tục từ xa DEL_MONHOC trên CSDL từ xa
TKTH.DHKT.EDU.VN để xóa môn học có mã là 2150112

Các câu lệnh DML chuẩn có hỗ trợ truy xuất CSDL từ xa tạo tính trong suốt cho người
dùng
SELECT, INSERT,UPDATE,DELETE,LOCK TABLE,SELECT…. FOR UPDATE (Có thể
không hỗ trợ cho hệ thống không đồng nhất)
Ví dụ: Từ CSDL DMDAOTAO ta tạo liên kết có tên TKTH.DHKT.EDU.VN để truy xuất
đến CSDL từ xa ở khoa thống kê tin học(TKTH). Sau đó ta sử dụng lệnh Insert để bổ sung
các môn học của khoa thống kê quản lý(có mã môn học bắt đầu bằng 215) từ kho dữ liệu
DMDAOTAO xuống kho CSDL từ xa của khoa TKTH
Đăng nhập vào CSDL DMDAOTAO và thực hiện lệnh Insert như sau:

13


Chú ý: Oracle không cho phép thực hiện các câu lệnh DDL như CREATE, ALTER, DROP
từ xa

Từ CSDL DATAWH tạo bảng TONGHOP sử dụng truy vấn phân tán truy xuất dữ liệu
trong các CSDL từ xa là và


4.4. Xây dựng công cụ quản trị kho dữ liệu phục vụ quản lý đào tạo
4.4.1.Cài đặt các Data Mart trên ORACLE
Như đã phân tích và thiết kế trong chương 3, các Data mart phục vụ quản lý đào tạo như
sau:
STT Tên CSDL Toàn cục(Database Link)
1
DATAWH.DHKT.EDU.VN
2
DMDAOTAO.DHKT.EDU.VN
16

SERVER
DW_SVR
DT_SVR

Giải thích
Tổng kho
Kho dữ liệu đào tạo


3

DMTKTH.DHKT.EDU.VN

TKTH_SVR



KETO_SVR

– Lê Nin
Kho dữ liệu khoa Kế

HACH_SVR

toán
Kho dữ liệu phòng

TAVU_SVR

Hành chính
Kho dữ liệu phòng Tài

5
6
7
8
9
10
11

DMTCNH.DHKT.EDU.VN
DMTMDL.DHKT.EDU.VN
DMKTPT.DHKT.EDU.VN
DMMALE.DHKT.EDU.VN
DMKETO.DHKT.EDU.VN
DMHACH.DHKT.EDU.VN

(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.11)(PORT = 1521))
)
(CONNECT_DATA =
(SID = DMTMDL)
(SERVER = DEDICATED)
)
)
DMTCNH =
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.12)(PORT = 1521))
)
(CONNECT_DATA =
(SID = DMTCNH)
(SERVER = DEDICATED)
)
)
18


DMKTPT =
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.13)(PORT = 1521))
)
(CONNECT_DATA =
(SID = DMKTPT)
(SERVER = DEDICATED)
)
)

(SERVER = DEDICATED)
)
)
DMTKTH =
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.17)(PORT = 1521))
)
(CONNECT_DATA =
(SID = DMTKTH)
(SERVER = DEDICATED)
)
)
DMDAOTAO =
(DESCRIPTION =
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.18)(PORT = 1521))
)
(CONNECT_DATA =
(SID = DMDAOTAO)
(SERVER = DEDICATED)
)
)
DMHACH =
(DESCRIPTION =
20


(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(HOST = 10.0.1.19)(PORT = 1521))


Tại một Data Mart nào muốn trao đổi với các Data Mart khác thì từ Data mart đó ta tạo các
liên kết dữ liệu(Database Link) đến các Data Mart muốn trao đổi. Tên miền CSDL cho các
Database Link trong hệ thống là DHKT.EDU.VN
Dưới đây là các Database Link từ tổng kho(DATAWH) đến các Data Mart khác

4.4.3. Xây dựng công cụ hỗ trợ quản lý kho dữ liệu đào tạo
Chức năng chính của công cụ hỗ trợ quản lý kho dữ liệu là trợ giúp cho người quản trị cơ
sở dữ liệu thực hiện tự động một số chức năng sau:
Chuyển đổi dữ liệu: Nhiệm vụ rất quan trọng khi khởi tạo một kho dữ liệu lag cho phép
người quản trị có thể chuyển đổi dữ liệu từ các định dạng khác nhau(MS Excel, MS
Access, XML, SQL SERVER) từ các nguồn khác nhau (các khoa, phòng) đã tồn tại trước
đó về định dạng thống nhất là ORACLE lưu trữ trong các Data Mart phục vụ công khai
thác dữ liệu phục vụ hoạt động tác nghiệp của nhà trường. cũng như chuyển đổi dữ liệu từ
ORACLE sang các định dạng dữ liệu khác để chia sẻ dữ liệu từ kho dữ liệu tới các người
sử dụng cuối. Đây là chức năng rất thiết thực cho công tác thu thập dữ liệu vì hiện tại các
khoa, phòng của nhà trường chưa có chương trình quản lý chung mà mỗi đơn vị ứng dụng
máy tính một cách riêng lẻ, tự phát. Hiện nay XML là chuẩn dữ liệu phổ biến để trao đổi
22


dữ liệu trên internet vì vậy hệ thống cũng hỗ trợ chuyển đổi qua lại từ định dạng XML vào
các nguồn dữ liệu khác(SQL SERVER, ORACLE) làm tăng khả năng trao đổi thông tin
của kho dữ liệu.

Tích hợp dữ liệu: Chức năng tích hợp dữ liệu cho phép người quản trị dữ liệu có thể trao
đổi dữ liệu từ các Data Mart khác nhau trong nhà trường. Nguên tắc của tích hợp dữ liệu
giữa các Data Mart các Data Mart trao đổi dữ liệu phải có các bảng có cấu trúc giống nhau
và dựa trên khóa chính.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status