Chương
Chương
6:
6:
Siêu
Siêu
d
d
ữ
ữ
li
li
ệ
ệ
u
u
Siêu d
Siêu d
ữ
ữ
li
li
ệ
ệ
u l
u l
à
à
g
g
ì
ni
ni
ệ
ệ
m
m
• Siêu dữ liệu là thành phần cơ bản để xây
dựng và quản lí một kho dữ liệu
• Trước khi một kdl có thể được truy cập một
cách có hiệu quả, thực sự là cần thiết để
hiểu, dữ liệu gì sẵn có trong kdl, và chúng lưu
trữ ở đâu.
• Dữ liệu miêu tả quá trình xây dựng, quản lí
và hoạt động của KDL
• Siêu dữ liệu được lưu trữ trong một kho chứa
và được truy cập bởi tất cả các thành phần
của kdl
Siêu
Siêu
d
d
ữ
ữ
li
li
ệ
ệ
u
u
Kh
ự
quan tr
quan tr
ọ
ọ
ng c
ng c
ủ
ủ
a siêu d
a siêu d
ữ
ữ
li
li
ệ
ệ
u
u
• Rất quan trọng trong kho dữ liệu
• Không phải là dữ kiện phân tích
• Là chìa khóa quyết định sự thành công của kho dữ
liệu
• Là thành phần luôn được thay đổi, cấp nhật theo sự
phát triển của kho dữ liệu
• Dùng để quản lý, điều khiển kho dữ liệu
Warehouse
Warehouse
Metadata
Metadata
ệ
ệ
u
u
• Quản lý được sự tích hợp
• Thể hiện được tính lịch sử
của dữ liệu
• Quản lý được các thay đổi
S
S
ự
ự
h
h
ì
ì
nh th
nh th
à
à
nh siêu d
nh siêu d
ữ
ữ
li
li
ệ
ệ
u
u
li
ệ
ệ
u
u
• Định nghĩa các chức năng chính của
siêu dữ liệu trong hệ thống kho dữ liệu
• Xác định các vấn đề trong tích hợp dữ
liệu.
• Xác định siêu dữ liệu có thể được tạo
như thế nào, ai tạo ra và được lưu trữ ở
đâu
• Miêu tả nội dung của siêu dữ liệu
Chi
Chi
ế
ế
n lư
n lư
ợ
ợ
c cho siêu d
c cho siêu d
ữ
ữ
li
li
ệ
ệ
u
truy cập như thế nào
• Xác định các nguồn
• Các hướng tích hợp
• Quản lí sự thay đổi và tiến triển của
KDL
C
C
á
á
c lo
c lo
ạ
ạ
i ngu
i ngu
ồ
ồ
n c
n c
ủ
ủ
a siêu d
a siêu d
ữ
ữ
li
li
ệ
ệ
u
tr
í
í
siêu d
siêu d
ữ
ữ
li
li
ệ
ệ
u
u
• Lưu tại máy chủ chứa kho dữ liệu
• Có thể được lưu tại các csdl nguồn
• Tại máy PC có công cụ quản lí siêu dữ
liệu
• Quản lý bởi người quản lí siêu dữ liệu
• Các chuẩn hóa được sinh ra bởi cấu
trúc siêu dữ liệu
C
C
á
á
c công c
c công c
ụ
ụ
v
v
li
li
ệ
ệ
u chi ti
u chi ti
ế
ế
t
t
• Hệ tương tác Operational
– Các tiến trình nạp, quản lý và lập lịch cho việc cập
nhập kdl
• ETT
– Quản lý các cấu trúc, ánh xạ
– Thông tin nguồn và đích
– Quản lý việc chuyển đổi
• Người dùng cuối (End user )
– Hỗ trợ việc sử dụng kho dữ liệu
– Hỗ trợ việc khảo sát kdl
– Hỗ trợ việc cung cấp thông tin cho kdl
Siêu d
Siêu d
ữ
ữ
li
li
ệ
ệ
u h
li
ệ
ệ
u
u
cho
cho
ETT
ETT
ánh xạ dữ liệu từ các nguồn vào kdl
Warehouse
Warehouse
Data Warehouse
Data Warehouse
Data Model
Data Model
Metadata
Metadata
Repository
Repository
Internal
Internal
sources
sources
External
External
sources
sources
Operational
Operational
110%
230%
200%
-10%
ABC CO
GMBH LTD
GBUK INC
FFR ASSOC
MCD CO
Siêu d
Siêu d
ữ
ữ
li
li
ệ
ệ
u cho vi
u cho vi
ệ
ệ
c chi
c chi
ế
ế
t (1)
t (1)
• Các luật kinh doanh
• Các khóa, trường và bảng nguồn
• Quản lí việc sở hữu dữ liệu
ệ
u cho vi
u cho vi
ệ
ệ
c chi
c chi
ế
ế
t (2)
t (2)
• Các yêu cầu về lưu trữ
• Thông tin về vị trí các
nguồn
• Sự khác nhau giữa các
nguồn
• Thông tin truy cập
• Bảo mật
• Các liên hệ, liên hệ với ai
để có dữ liệu
• Các tên chương trình
• Các thông tin quản lý tính
chất của dữ liệu
External
External
Sources
Sources
Operational
Operational
Data
Metadata
Metadata
repository
repository
ETT
Mapping
Stagin
Stagin
g
g
file
file
Transport
T
T
í
í
ch h
ch h
ợ
ợ
p v
p v
à
à
thay đ
thay đ
ổ
ổ
i
ng
cu
cu
ố
ố
i
i
(1)
(1)
Warehouse
Warehouse
Metadata
Metadata
Repository
Repository
End
User
Operational
ETT
Mapping
IT
IT
staff
staff
Users
Users
Siêu d
Siêu d
ữ
ữ
ữ
ữ
li
li
ệ
ệ
u ngư
u ngư
ờ
ờ
i d
i d
ù
ù
ng cu
ng cu
ố
ố
i (3)
i (3)
• Ví trí của các chiều và dữ kiện
• Miêu tả nội dung
• Các thuật toán để tạo ra các tổng hợp
• Thông tin về người sử dụng kdl
Warehouse
Warehouse
Metadata
Metadata
repository
repository