(Luận văn thạc sĩ) nghiên cứu giải pháp kho dữ liệu trong SQL server 2008 và áp dụng trong thương mại - Pdf 70

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN VĂN THÀNH

NGHIÊN CỨU GIẢI PHÁP KHO DỮ LIỆU TRONG
SQL SERVER 2008 VÀ ÁP DỤNG TRONG THƯƠNG MẠI

LUẬN VĂN THẠC SĨ

Hà Nội - 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN VĂN THÀNH

NGHIÊN CỨU GIẢI PHÁP KHO DỮ LIỆU TRONG
SQL SERVER 2008 VÀ ÁP DỤNG TRONG THƯƠNG MẠI

Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống Thông tin
Mã số: 60 48 05

LUẬN VĂN THẠC SĨ

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. Đỗ Trung Tuấn

Hà Nội – 2011


2.4.3. Dịch vụ phân tích ............................................................................. 31
2.4.4. Bộ cơng cụ phát triển trí tuệ doanh nghiệp ........................................ 33
2.4.5. Công cụ quản lý SQL Server ............................................................ 34
2.4.6. Dịch vụ tác nhân SQL Server ........................................................... 35
2.5. Qui trình xây dựng kho dữ liệu của Microsoft ......................................... 36
2.6. Tổng kết chương ..................................................................................... 37
Chương 3. XÂY DỰNG KHO DỮ LIỆU SIÊU THỊ ......................................... 38
3.1. Giới thiệu về siêu thị ............................................................................... 38
3.2. Yêu cầu xây dựng kho dữ liệu ................................................................. 39


2

3.3. Phạm vi thực hiện trong luận văn ............................................................ 41
3.4. Dữ liệu nguồn cho kho dữ liệu ................................................................ 41
3.5. Xây dựng kho dữ liệu siêu thị ................................................................. 44
3.5.1. Kiến trúc tổng thể kho dữ liệu .......................................................... 44
3.5.2. Thiết kế cấu trúc dữ liệu ................................................................... 46
3.5.3. Thiết kế vật lý .................................................................................. 50
3.5.4. Thiết kế các gói tích hợp dữ liệu ....................................................... 52
3.5.5. Thiết kế khối dữ liệu......................................................................... 59
3.5.6. Khai thác khối dữ liệu ...................................................................... 62
3.5.7. Tạo các mẫu báo cáo phân tích ......................................................... 66
3.5.8. Tạo lịch thực hiện cơng việc tự động ................................................ 66
3.6. Tổng kết chương ..................................................................................... 67
Chương 4. KẾT QUẢ CÀI ĐẶT THỬ NGHIỆM ............................................. 68
4.1. Môi trường cài đặt................................................................................... 68
4.2. Dữ liệu thử nghiệm ................................................................................. 68
4.3. Kết quả chạy thử nghiệm ........................................................................ 70
4.3.1. Thời gian chạy tích hợp dữ liệu ........................................................ 70


Business Intelligent

Trí tuệ doanh nghiệp

BIDS

Business Intelligent Development Studio

Trình phát triển trí tuệ doanh
nghiệp

DM

Data Mart

Kho dữ liệu chuyên biệt

DW

Data Warehouse

Kho dữ liệu

XML

Extensible Markup Language

Ngôn ngữ đánh dấu mở rộng


ODS

Operational Database Store

Kho dữ liệu tác nghiệp

POS

Point Of Sale

Điểm bán hàng

RDBMS

Relational DataBase Management

Hệ quản trị CSDL quan hệ

System
ROLAP

Relational OLAP

OLAP quan hệ

SCD

Slowly Changing Dimension

Chiều thay đổi chậm

Mơ hình chiều thống nhất


4

DANH SÁCH HÌNH VẼ
Hình 1.1. Đặc tính của kho dữ liệu ...................................................................... 8
Hình 1.2. Kiến trúc kho dữ liệu ......................................................................... 11
Hình 1.3. Ví dụ về lược đồ hình sao .................................................................. 12
Hình 1.4. Ví dụ phân tích dữ liệu bởi người dùng .............................................. 13
Hình 1.5. Qui trình xây dựng kho dữ liệu .......................................................... 14
Hình 1.6. Các bước xây dựng mơ hình kho dữ liệu ............................................ 16
Hình 1.7. Ví dụ về các bảng tổng hợp ................................................................ 17
Hình 1.8. Mơ hình SMP .................................................................................... 18
Hình 1.9. Mơ hình Cluster ................................................................................. 19
Hình 2.1. Giải pháp DW/BI của Microsoft ........................................................ 22
Hình 2.2. Kiến trúc dịch vụ tích hợp SSIS ......................................................... 25
Hình 2.3. Ví dụ về một luồng dữ liệu ................................................................ 27
Hình 2.4. Kiến trúc dịch vụ báo cáo SSRS ........................................................ 30
Hình 2.5. Kiến trúc dịch vụ phân tích SSAS ...................................................... 32
Hình 2.6. Màn hình khởi tạo mẫu dự án DW/BI trong BIDS ............................. 34
Hình 2.7. Màn hình quản lý của SQL Server ..................................................... 35
Hình 2.8. Màn hình tạo cơng việc ...................................................................... 35
Hình 2.9. Qui trình xây dựng kho dữ liệu của Microsoft .................................... 36
Hình 3.1. Mơ hình hoạt động của phềm mềm quản lý siêu thị............................ 38
Hình 3.2. Các chiều phân tích theo các chủ đề ................................................... 40
Hình 3.3. Sơ đồ quan hệ các bảng dữ liệu nguồn ............................................... 43
Hình 3.4. Kiến trúc tổng thể kho dữ liệu siêu thị................................................ 44
Hình 3.5. Sơ đồ cấu trúc các bảng dữ liệu của SieuThi_DW .............................. 47
Hình 3.6. Sơ đồ cấu trúc các bảng dữ liệu của SieuThi_DM .............................. 49

Bảng 4.1. Số bản ghi của các bảng trong SieuThi_SRC ..................................... 68
Bảng 4.2. Số bản ghi của các bảng trong SieuThi_DW ...................................... 69
Bảng 4.3. Số bản ghi của các bảng trong SieuThi_DM ...................................... 69


6

LỜI MỞ ĐẦU
Việc xây dựng kho dữ liệu phục vụ cho phân tích và báo cáo của các doanh
nghiệp sẽ là xu thế tất yếu trong những năm tới ở Việt nam. Thực ra, kho dữ liệu đã
được áp dụng khá phổ biến tại các nước phát triển như Mỹ, Úc, Đức, Nhật... Tại Việt
nam thì cho đến nay kho dữ liệu cũng đã được bắt đầu áp dụng cho một số ngành đi
tiên phong trong lĩnh vực CNTT như Ngân hàng, Tài chính và Bưu chính Viễn thơng.
Nhưng nhìn chung số lượng doanh nghiệp có kho dữ liệu là chưa nhiều, vì các doanh
nghiệp vẫn đang phải ưu tiên phần mềm phục vụ tác nghiệp như kế toán, nhân sự, tiền
lương, bán hàng, đặt hàng, hoạch định doanh nghiệp, phần mềm lõi, phần mềm quản
lý quan hệ khách hàng... Nhưng trong vài năm tới, khi các phần mềm tác nghiệp đã
được áp dụng phổ biến và chạy ổn định thì việc làm thế nào để khai thác được khối dữ
liệu tác nghiệp đã có một cách hiệu quả nhất là điều mà các doanh nghiệp sẽ rất quan
tâm.
Nhận thấy được xu thế này, nên tên đề tài đã được đăng ký là “Nghiên cứu giải
pháp kho dữ liệu trong SQL Server 2008 và áp dụng trong Thương mại” cho luận văn
tốt nghiệp. Hy vọng đây là cơ hội tốt để nghiên cứu và tìm hiểu tổng quan về kho dữ
liệu và qui trình xây dựng nó, để nghiên cứu các giải pháp công nghệ cho kho dữ liệu
của Microsoft nói chung và của SQL Server 2008 nói riêng, và cuối cùng là việc áp
dụng những gì nghiên cứu được để xây dựng thử nghiệm kho dữ liệu cho bài toán thực
tế trong lĩnh vực thương mại.
Nhờ sự giúp đỡ của bạn bè mà một phần dữ liệu để thử nghiệm và một số yêu
cầu về kho dữ liệu của siêu thị bán lẻ T-Mart đã được thu thập. Vì vậy, bài toán áp
dụng thử nghiệm là xây dựng kho dữ liệu cho siêu thị T-Mart.

1.1. Các khái niệm
1.1.1. Kho dữ liệu
Định nghĩa: kho dữ liệu (Data Warehouse - DW) là tuyển tập các CSDL tích hợp,
hướng chủ đề, được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định, mà mỗi đơn
vị dữ liệu đều liên quan tới một khoảng thời gian cụ thể. [1]
Thực ra, cũng có nhiều định nghĩa về kho dữ liệu khác nhau, nhưng tất cả đều
hướng đến mục đích là hỗ trợ cho chức năng trợ giúp quyết định.
Ngoài việc chứa đựng một CSDL quan hệ, kho dữ liệu còn bao gồm các bước
tích hợp dữ liệu, cơng nghệ OLAP, các cơng cụ phân tích, và các ứng dụng cho việc
thu thập và cung cấp dữ liệu tới người sử dụng
1.1.2. Mục đích của kho dữ liệu
Mục tiêu chính của kho dữ liệu là nhằm đáp ứng các vấn đề cơ bản sau:
Tích hợp dữ liệu từ nhiều nguồn khác nhau;
Nâng cao chất lượng dữ liệu bằng các phương pháp làm sạch và tinh lọc
dữ liệu theo những hướng chủ đề nhất định;
Sử dụng cho các hệ thống hỗ trợ quyết định, các hệ thống thông tin tác
nghiệp hoặc hỗ trợ cho các truy vấn đặc biệt.
1.1.3. Đặc tính của kho dữ liệu
Kho dữ liệu có các đặc tính như Hình 1.1, gồm bốn đặc tính sau:

Hình 1.1. Đặc tính của kho dữ liệu


9

Hướng chủ đề;
Tính tích hợp;
Tính ổn định;
Tính lịch sử hay có biến thời gian.
1.1.3.1. Hướng chủ đề


10

trong kho vẫn khơng bị xố và sửa đổi, điều đó cho phép cung cấp thơng tin về một
khoảng thời gian dài, cung cấp đủ số liệu cần thiết cho các mơ hình nghiệp vụ phân
tích, dự báo.
Tuy nhiên, trong thực tế nếu các bảng dữ liệu có kích thước q lớn thì cũng phải
có kế hoạch để lưu trữ bớt các dữ liệu trong quá khứ, thời gian có thể sau 5-10 năm tuỳ
theo yêu cầu nghiệp vụ báo cáo liên quan. Sau khi lưu trữ dữ liệu cũ thì có thể xố đi
hoặc lưu trữ sang chỗ khác để giảm bớt dung lượng cần cho việc lưu trữ và tăng tốc độ
truy cập.
1.1.3.4. Tính lịch sử
Tính lịch sử thể hiện rằng yếu tố thời gian luôn được lưu trữ trong kho dữ liệu.
Kho dữ liệu thường chứa một khối lượng lớn dữ liệu trong quá khứ, dữ liệu được lưu
trữ thành hàng loạt các bản chụp ảnh, mỗi bản ghi phản ánh giá trị của dữ liệu tại một
thời điểm nhất định. Điều này cho phép người sử dụng có thể lấy lại dữ liệu lịch sử và
so sánh dữ liệu cho các giai đoạn khác nhau. Yếu tố thời gian đóng vai trị như một
phần của khố để đảm bảo tính duy nhất của một hàng và cung cấp đặc trưng về thời
gian cho dữ liệu.
1.1.4. Phân biệt kho dữ liệu với cơ sở dữ liệu tác nghiệp
Trên cơ sở các đặc trưng của kho dữ liệu thì có thể phân biệt kho dữ liệu với
những CSDL tác nghiệp như sau:
Kho dữ liệu được xây dựng theo hướng chủ đề, nó được thực hiện theo ý
đồ của người sử dụng đầu cuối.
Kho dữ liệu thường quản lý một khối lượng lớn thông tin hơn so với
CSDL tác nghiệp.
Kho dữ liệu có thể lưu trữ các thơng tin tổng hợp theo một chủ đề nghiệp
vụ nào đó sao cho tạo ra các thông tin phục vụ hiệu quả cho việc phân tích
của người sử dụng.
Kho dữ liệu thơng thường chứa các dữ liệu lịch sử kết nối nhiều năm của

Dữ liệu tổng hợp: đây là phần chứa dữ liệu ở mức tổng hợp hơn, được
nhóm theo một số chiều nhất định, tùy theo mục đích cụ thể của từng tổ
chức mà tạo ra các bảng tổng hợp khác nhau. Các bảng dữ liệu tổng hợp


12

này thường tổ chức phi chuẩn và được dùng cho mục đích phân tích báo
cáo cũng như đầu vào dữ liệu cho việc xây dựng các kho dữ liệu chuyên
biệt.
1.2.3. Kho dữ liệu chuyên biệt
Kho dữ liệu chuyên biệt là thành phần chứa dữ liệu tổng hợp theo một chủ đề nào
đó như bán hàng, tồn kho, đặt hàng, thu nợ... nhằm phục vụ cho việc truy vấn, báo cáo
và phân tích dữ liệu một cách dễ dàng và nhanh chóng có kết quả. Trong thành phần
này mơ hình dữ liệu thường được tổ chức dưới dạng lược đồ hình sao, bao gồm bảng
dữ liệu thống kê nằm ở trung tâm gọi là bảng sự kiện và các chiều thống kê gọi là bảng
chiều nằm ở xung quanh.
Ví dụ: lược đồ hình sao về bán hàng như Hình 1.3 ở dưới.

Hình 1.3. Ví dụ về lược đồ hình sao

1.2.4. Kho siêu dữ liệu
Kho siêu dữ liệu là thành phần chứa dữ liệu định nghĩa về cấu trúc kho dữ liệu,
định nghĩa về các cơng việc (Job) cho q trình tích hợp, chứa các dữ liệu về người sử
dụng và quyền hạn... Nó có thể được lưu trữ trong một cơ sở dữ liệu quan hệ hoặc
dưới dạng hệ thống tập tin có cấu trúc.
1.2.5. Vùng chứa tạm
Vùng chứa tạm là thành phần chứa dữ liệu trung gian phục vụ cho q trình tích
hợp dữ liệu được hiệu quả hơn, nó khơng có ý nghĩa với người dùng đầu cuối. Vùng


cơ bản sau:
Lập kế hoạch xây dựng kho dữ liệu: kết quả là phải đưa ra được tập các
yêu cầu cho việc xây dựng kho dữ liệu và kế hoạch thực hiện.
Phân tích yêu cầu người sử dụng: để tập hợp được tất cả các u cầu của
người sử dụng.
Xây dựng mơ hình kho dữ liệu: định nghĩa mơ hình nghiệp vụ, tạo mơ
hình logic và tạo mơ hình dữ liệu vật lý.
Lập kế hoạch cài đặt vật lý: bao gồm việc lựa chọn kiến trúc tính tốn cho
hệ thống máy chủ phục vụ cho kho dữ liệu và lập kế hoạch lưu trữ dữ liệu.
Xây dựng qui trình tích hợp cho kho dữ liệu: xây dựng ra các cơng việc để
thực hiện việc tích hợp dữ liệu từ nguồn vào kho dữ liệu.
Quản trị kho dữ liệu: cài đặt đưa vào sử dụng kho dữ liệu, quản lý khai
thác và cập nhật dữ liệu liên tục cho kho dữ liệu.
1.3.2. Chi tiết các bước xây dựng kho dữ liệu
1.3.2.1. Lập kế hoạch xây dựng kho dữ liệu
Việc lập kế hoạch xây dựng kho dữ liệu bao gồm các nội dung cơ bản sau:
Lập kế hoạch tài chính: phải ước lượng được tổng chi phí cần đầu tư cho
việc xây dựng và phát triển kho dữ liệu cũng như ai là người cung cấp và
quản lý chi phí.


15

Lập kế hoạch về nghiệp vụ: phải định nghĩa được các mục đích nghiệp vụ
mà kho dữ liệu sẽ mang lại, định nghĩa các chủ đề mà kho dữ liệu sẽ
hướng đến.
Lập kế hoạch về kỹ thuật: phải xác định được yêu cầu kỹ thuật để đáp ứng
cho kho dữ liệu. Bao gồm bản thiết kế kiến trúc tổng thể của kho dữ liệu,
mô tả các chức năng của từng thành phần cấu thành nên kho dữ liệu, yêu
cầu cụ thể về phần mềm, phần cứng và các tài nguyên mạng, sự ước lượng


Việc xác định mơ hình nghiệp vụ dựa trên các bước sau:
Xác định các yêu cầu nghiệp vụ.
Xác định các đại lượng tính tốn như số lượng, thành tiền, khuyến mãi...
Xác định các chiều dữ liệu như hàng hoá, khách hàng, kênh bán hàng,
vùng miền, thời gian...
Xác định các định nghĩa nghiệp vụ và các qui tắc nghiệp vụ.
Xác định nguồn dữ liệu chính: nguồn dữ liệu có liên quan đến các nghiệp
vụ cần thiết cho kho dữ liệu.
Xác định nguồn dữ liệu khác: nguồn dữ liệu từ bên ngoài, dữ liệu khơng
phải dạng CSDL quan hệ.
Tạo mơ hình logic: thực hiện sau khi xác định được các chủ đề cho kho dữ liệu
thì cần xác định mơ hình logic của kho dữ liệu. Có ba loại kiểu mơ hình thường dùng
cho kho dữ liệu là: mơ hình chuẩn hố, mơ hình phi chuẩn hố và mơ hình hình sao.
Chi tiết cho từng mơ hình như sau:
Mơ hình chuẩn hố: tức là dữ liệu được tổ chức theo chuẩn, thường là theo
chuẩn 3NF giống như khi tổ chức dữ liệu trong OLTP.
Mơ hình phi chuẩn: dữ liệu được lưu trữ đầy trong các bảng. Mục đích là
phi chuẩn hố các bảng để thêm hầu hết các cột được truy nhập vào một


17

bảng chung để tránh việc kết hợp các bảng lại với nhau nhằm tăng tốc độ
truy vấn và dễ dàng thực hiện truy vấn.
Mơ hình hình sao: dữ liệu được tổ chức thành các sơ đồ hình sao gồm có
một bảng sự kiện nằm ở trung tâm và các bảng chiều nằm ở xung quanh.
Bảng sự kiện chứa các đại lượng tính tốn và các trường tham chiếu tới
các bảng chiều.
Tạo mơ hình mức tổng hợp: mơ hình này chứa các loại bảng dữ liệu sau:

Cấu hình tối ưu cho kho dữ liệu: bằng cách thiết lập các tham số cho
CSDL để tăng hiệu năng thực hiện truy vấn và đảm bảo an tồn cho kho
dữ liệu.
Cấu hình cho kho dữ liệu chạy ở chế độ song song.
1.3.2.4. Lập kế hoạch cài đặt vật lý
Việc cài đặt vật lý cho kho dữ liệu cũng cần được xem xét một cách kỹ lưỡng khi
tiến hành xây dựng kho dữ liệu, nó bao gồm nhiều công việc khác nhau như chuẩn bị
cơ sở hạ tầng mạng máy tính, máy chủ, thiết bị lưu trữ, thiết bị sao lưu, thiết bị bảo
mật... Nhưng chủ yếu sẽ tập trung vào hai yếu tố quan trọng khi cài đặt vật lý là: chọn
lựa mơ hình vật lý và lập giải pháp lưu trữ cho kho dữ liệu.
Chọn lựa mơ hình vật lý: việc xác định mơ hình vật lý thường theo một trong các
mơ hình phổ biến sau:
Mơ hình SMP (Symmetric Multi-Processing): tức là kiến trúc mà nhiều
CPU trên cùng một máy chủ cùng chia sẻ một bộ nhớ và hệ thống đĩa, chi
tiết như Hình 1.8 bên dưới.

Hình 1.8. Mơ hình SMP

Mơ hình Cluster: là mơ hình mà gồm có nhiều máy chủ được nối với nhau
thành một khối thống nhất và cùng chia sẻ chung hệ thống đĩa ngồi, như
Hình 1.9, cùng tham gia vào xử lý các cơng việc với nhau. Ở góc độ người
dùng có thể xem các máy chủ này tương đương như một máy chủ. Các
máy chủ này thường được nối với nhau thông qua một thiết bị hỗ trợ băng
thông rộng.


19

Hình 1.9. Mơ hình Cluster


Sau khi kho dữ liệu được đưa vào sử dụng thì u cầu rất quan trọng là nó phải
được quản lý và theo dõi thường xuyên, sao cho đảm bảo thông suốt cho người dùng
khai thác thông tin hiệu quả nhất. Việc quản trị kho dữ liệu bao gồm các tác vụ sau:
Quản lý về an toàn, bảo mật và độ ưu tiên.
Quản lý sự truy cập từ nhiều người khác nhau.
Kiểm tra chất lượng dữ liệu thường xuyên.
Kiểm tra q trình tích hợp thường xun.
Quản lý và cập nhật kho siêu dữ liệu.
Giám sát và lập các báo cáo về tình hình sử dụng và trạng thái của kho dữ
liệu như thời gian sử dụng, số người khai thác, thời gian đáp ứng các yêu
cầu...
Quản lý qui trình sao lưu.
Lập kế hoạch sẵn sàng phục hồi kho dữ liệu khi có sự cố.
Lập kế hoạch để nâng cấp và mở rộng hệ thống đĩa, bộ nhớ, băng thông...
sẵn sàng cho sự gia tăng kích cỡ của kho dữ liệu theo thời gian.
Lập kế hoạch lưu trữ bớt các dữ liệu cũ không cần thiết cho việc khai thác
ra các thiết bị lưu trữ ngoài kho dữ liệu.
Lập kế hoạch mở rộng phạm vi dữ liệu của kho dữ liệu khi yêu cầu nghiệp
vụ thay đổi.
1.3.2.7. Hỗ trợ khai thác kho dữ liệu
Cái đích chính của việc xây dựng kho dữ liệu là cung cấp thông tin hỗ trợ cho
các nhà quản lý đưa ra các quyết định chiến lược hiệu quả hơn. Nên phải có kế hoạch
trang bị các công cụ và đào tạo sử dụng nhằm nâng cao khả năng khai thác kho dữ
liệu.
1.4. Tổng kết chương
Chương này chủ yếu trình bày một cách cơ đọng các nội dung cơ bản về kho dữ
liệu, với mục đích chỉ đưa ra các nội dung cơ bản làm nền tảng cho các chương tiếp
theo. Các nội dung được trình bày bao gồm các khái niệm, các đặc tính, kiến trúc tổng
thể, và qui trình thực hiện việc xây dựng kho dữ liệu.


tiếp nhận và phát triển mở rộng cho kho dữ liệu.
Tính mở: mặc dù có thể xây dựng một kho dữ liệu hoàn chỉnh chỉ sử dụng
duy nhất các cơng cụ của Microsoft nhưng các cơng cụ này hồn tồn có
thể được thay thế bởi các cơng cụ của các nhà phát triển thứ ba.
Tính hiệu năng cao và mở rộng: tính đến thời điểm hiện nay thì kho dữ
liệu được xây dựng dựa trên công nghệ của Microsoft có dung lượng đến
10 terabytes khá phổ biến và đã có một số kho dữ liệu mà dung lượng đạt
đến mức 50 terabytes. Microsoft cũng đã và đang mở rộng các dòng sản


22

phẩm của SQL Server cho phép xử lý song song nhằm hướng đến kho dữ
liệu mức hàng trăm terabytes.
Microsoft đã đẩy mạnh đầu tư vào lĩnh vực trí tuệ doanh nghiệp, bản thân SQL
Server 2008 đã tích hợp bộ cơng cụ phát triển ứng dụng trí tuệ doanh nghiệp một cách
đầy đủ từ việc tích hợp dữ liệu, đến việc lập báo cáo, phân tích số liệu, và quản lý.
2.2. Giải pháp tổng thể kho dữ liệu của Microsoft
Những năm gần đây Microsoft đã tập trung vào giải pháp trí tuệ doanh nghiệp
nói chung hay hẹp hơn là giải pháp kho dữ liệu, họ xác định đây là một trong những
hướng chính mà hãng sẽ tiếp tục theo đuổi. Giải pháp tổng thể của Microsoft cho
DW/BI được thể hiện như Hình 2.1 bên dưới.

Hình 2.1. Giải pháp DW/BI của Microsoft

Tầng dữ liệu nguồn: là tầng chứa dữ liệu nguồn cho kho dữ liệu, có thể lấy dữ
liệu từ nhiều ứng dụng khác nhau như Microsoft Dynamic, Siebel, SAP... và từ nhiều
hệ quản trị CSDL khác nhau như Oracle, DB2, Informix…
Tầng nền tảng: là tầng chứa tồn bộ cơng cụ nền tảng cho trí tuệ doanh nghiệp.
Tầng này bao gồm các cơng cụ và dịch vụ sau:

Cung cấp câu lệnh thao thác gộp, câu lệnh này thực hiện các thao tác đối
với các bảng dữ liệu với hiệu năng rất tốt ngoài ra cũng nhờ gộp các thao
tác thêm mới, sửa và xóa vào một câu lệnh nên giúp việc viết các câu lệnh
sáng sủa và nhanh hơn.
Cải tiến câu lệnh chèn vào bảng một tập các hàng dữ liệu từ câu lệnh chọn
nhằm tăng tốc độ thực hiện và giảm thiểu bộ nhớ làm việc.
Hỗ trợ khả năng bắt các sự thay đổi (Change Data Capture - CDC) cho
CSDL nguồn chạy trên SQL SERVER 2008, đây là khả năng tự đánh dấu
sự thay đổi của một bảng theo thời gian và cho phép lấy ra tập dữ liệu thay
đổi trong một khoảng thời gian chỉ ra. Tính năng này thường áp dụng cho
các bảng dữ liệu nguồn mà chưa có cột ghi lại sự thay đổi dữ liệu theo thời
gian.
Cải tiến cơng cụ tra cứu dùng cho tích hợp, cho phép sử dụng bộ nhớ đệm
một cách tối đa tại máy chủ tích hợp.



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status