Chương
Chương
3:
3:
Ki
Ki
ế
ế
n tr
n tr
ú
ú
c kho d
c kho d
ữ
ữ
li
li
ệ
ệ
u
u
Ki
Ki
ế
ế
n
n
tr
tr
ú
ú
ú
c
c
kho
kho
d
d
ữ
ữ
li
li
ệ
ệ
u
u
chi
chi
ti
ti
ế
ế
t
t
Tầng thể hiện
Tầng OLAP
Tầng thu thập
T
T
ầ
nh
• Được biết đến như là một phần của kho dữ
liệu
• Cung cấp các báo cáo, phân tích tiền tính
toán, các đồ thị, biểu đồ
• Cho phép phân tích cao trực tuyến dữ liệu
• Thăm dò sự tương tác dữ liệu
• Cung cấp các giao diện người dùng phức tạp
• Cung cấp khả năng phân tích dữ liệu phức
tạp bằng phuong thức đơn giản
T
T
ầ
ầ
ng 1
ng 1
-
-
C
C
á
á
c h
c h
ệ
ệ
HTQĐ
HTQĐ
(tt)
(tt)
– Khám phá ngược với dự đoán
– Báo cáo kinh doanh
– Thống kê
– Phân tích khuynh hướng
– Các cây quyết định
– Qui nạp
– Các hệ thống mờ
– Các hệ thống chuyên gia
– Mạng nơron
– Các thuật toán di truyền
T
T
ầ
ầ
ng 1
ng 1
-
-
C
C
á
á
c b
c b
á
á
o c
o c
á
á
• Các đơn vị cạnh tranh đang làm gì ? Họ
ảnh hưởng ra sao đến mối quan hệ
giữa công ty và khách hàng ?
• Loại ô tô màu nào có giá từ 20.000 đến
50.000 USD bán chạy nhất ?
• Mặt hàng nào bán chạy nhất trong các
kì noel gần đây ?
T
T
ầ
ầ
ng 2
ng 2
-
-
OLAP
OLAP
• Vào giữa các năm 1990: OLAP-Online
Analytical Processing
• Kỹ thuật phân tích đa chiều của đa tập dữ
liệu lớn
• 12 tiêu chuẩn đánh giá được đề cập bởi E.F.
Codd
• Dữ liệu được trình bày theo mô hình đa chiều
• Công nghệ OLAP cho phép truy cập nhanh
tới các toán tử hỗ trợ đặt biệt như rolling-up,
drilling down,
T
T
ầ
a OLAP
a OLAP
• Là một loại phần mềm cho phép:
– Phân tích
– Quản lý
– Và thực hiện để :
• Truy cập nhanh, nhất quán dữ liệu
• Dữ liệu được chuyển đổi từ mức thô sang cấu
trúc đa chiều
Theo hiệp hội OLAP www.olap.org 1995
• 12 tiêu chuẩn để đánh giá OLAP tools của
E.F. Codd
T
T
ầ
ầ
ng 2
ng 2
-
-
12 tiêu chu
12 tiêu chu
ẩ
ẩ
n
n
• Khung nhìn khái niệm đa chiều: mô hình đa chiều
tương ứng với các vấn đề kinh doanh
• Trong suốt:hệ qt csdl, sự hỗn tạp của dữ liệu nguồn,
và kiến trúc trong suốt tới user
• Không giới hạn số chiều và mức độ tổng hợp
T
T
ầ
ầ
ng
ng
2
2
-
-
D
D
ữ
ữ
li
li
ệ
ệ
u
u
đa
đa
chi
chi
ề
ề
u
u
Geography
d
d
ụ
ụ
v
v
ề
ề
phân
phân
c
c
ấ
ấ
p
p
1999
Q1.1999
Jan.1999
W1.1999
all
W5.1999 W9.1999
Feb.1999 Mar.1999
1.Jan.1999
6.Jan.1999 1.Feb.1999 3.Feb.1999 3.Mar.1999
Phõn
Phõn
c
c
ấ
{1 10} < inexpensive
T
T
ầ
ầ
ng
ng
2
2
-
-
V
V
í
í
d
d
ụ
ụ
d
d
ữ
ữ
ki
ki
ệ
ệ
n
n
v
(Dollars_Sold,Min)
(Unit_Sold,Sum)
(Dollars_Cost,Max)
T
T
ầ
ầ
ng
ng
2
2
-
-
V
V
í
í
d
d
ụ
ụ
c
c
ủ
ủ
a
a
t
t
ổ
Date
Product
Country
sum
sum
TV
VCR
PC
1Qtr
2Qtr
3Qtr
4Qtr
U.S.A
Canada
Mexico
sum
Cube: M
Cube: M
ộ
ộ
t lư
t lư
ớ
ớ
i c
i c
á
á
c Cuboid
c Cuboid
• OLAP capabilities
• Interactive manipulation
T
T
ầ
ầ
ng
ng
2
2
-
-
V
V
í
í
d
d
ụ
ụ
c
c
ủ
ủ
a
a
chuy
chuy
ể
ể
ng
2
2
-
-
V
V
í
í
d
d
ụ
ụ
c
c
ủ
ủ
a
a
rolling
rolling
up
up
Geography
Product
Item
Type
Category
All
City
ủ
ủ
a
a
Drilling
Drilling
down
down
Geography
Product
Item
Type
Category
All
City
State
Country
All
Time
Month
Year
Day
Week
All
Quarter
T
T
ầ
ầ
ng