Data Warehouse and Business Intelligence 1
Chương 2:
Qui trình phát triển kho dữ liệu
Data Warehouse and Business Intelligence 2
Nội dung
1. Tổng quan
2. Các phương pháp luận phát triển kho dữ liệu
3. Hoạch định kho dữ liệu
4. Business Dimensional Lifecycle
Data Warehouse and Business Intelligence 3
1. Tổng quan
Một số câu hỏi quan trọng cần được xem xét trước khi
quyết định xây dựng kho dữ liệu:
Theo các tiếp cận Top-down hay bottom-up ?
Dùng cho mức doanh nghiệp hay phòng ban ?
Cái nào trước —data warehouse hay data mart ?
Build pilot or go with a full-fledged implementation?
Data mart phục thuộc hay độc lập ?
Data Warehouse and Business Intelligence 4
2. Các phương pháp phát triển KDL
Có 2 phương pháp phát triển chính:
Top-Down
Bottom-Up
Data Warehouse and Business Intelligence 5
2.1 Top-Down
Dữ liệu trong KDL được lưu trữ ở mức “hạt” thấp nhất
dựa trên mô hình dữ liệu đã chuẩn hóa
KDL là trung tâm của “Xưởng thông tin công ty” (CIF)
cung cấp một khung luận lý cho việc chuyển giao kinh
doanh thông minh đến doanh nghiệp. Các hoạt động
kinh doanh cung cấp dữ liệu cho CIF.
Vốn có thể phát triển
Cho phép nhóm dự án học tập và tăng trưởng
Hạn chế:
Mội data mart có cái nhìn hẹp về dữ liệu
Tràn ngập dữ liệu dư thừa trong mỗi data mart
Tràn ngập dữ liệu không tương thích và bất thường
Gia tăng các giao diện không thể quản lí
Data Warehouse and Business Intelligence 9
3. Hoạc định cho KDL
3.1 Các vấn đề then chốt
3.2 Các yêu cầu nghiệp vụ phi công nghệ
3.3 Hỗ trợ của quản lí cấp cao
3.4 Biện minh cho KDL
3.5 Kế hoạch tổng thể
Data Warehouse and Business Intelligence 10
3.1 Các vấn đề then chốt
Giá trị và những mong đợi
Đánh giá rủi ro
Top-Down hoặc Bottom-Up
Xây dựng hoặc mua
Single Vendor hoặc Best-of-Breed
Data Warehouse and Business Intelligence 11
3.2 Các yêu cầu nghiệp vụ phi công nghệ
Các yêu cầu nghiệp vụ điều khiển KDL chứ không phải
công nghệ
Giải quyết nhu cầu người dùng về thông tin chiến lược
Không lập kế hoạch xây dựng KDL trước khi hiểu yêu
cầu
Bắt đầu bằng việc tập trung vào thông tin gì là cần thiết,
không phải làm thế nào để cung cấp thông tin
4. The Business Dimensional Lifecycle
(Ralph Kimball,etc, 2001, The Data Warehouse Lifecycle Toolkit)
Data Warehouse and Business Intelligence 16
4. The Business Dimensional Lifecycle (tt.)
Minh họa luồng tổng thể của việc thực hiện KDL
Xác định tuần tự các nhiệm vụ và các hoạt động chính
thực hiện đồng thời
Có thể có chỉnh sửa để đáp ứng những nhu cầu đơn nhất
của tổ chức
Data Warehouse and Business Intelligence 17
4.1 Hoạch định dự án
Hoạch định dự án nhấn vào định nghĩa và phạm vi dữ liệu
bao gồm việc đánh giá sự sẵn sàng và minh chứng về mặt
kinh doanh
Tập trung vào nguồn lực và cấp độ kỹ năng của nhân viên
Hoạch định dự án phụ thuộc vào các yêu cầu kinh doanh
Data Warehouse and Business Intelligence 18
4.2 Xác định các yêu cầu kinh doanh
Hiểu yêu cầu kinh doanh của người dùng là trở ngại lớn
nhất đối với sự thành công của KDL
Các yêu cầu kinh doanh thiết lập thông qua 3 luồng song
song tập trung vào công nghệ, dữ liệu và các ứng dụng
người dùng
Data Warehouse and Business Intelligence 19
Ba luồng song song
Application
Track
Technology
Track
Data Track
Các chiến lược đánh chỉ mục và phân hoạch sơ bộ cũng
cần được xem xét
Data Warehouse and Business Intelligence 23
4.6 Thiết kế và phát triển dữ liệu tạm
Thường bị đánh giá thấp nhất trong dự án KDL
Bao gồm 3 bước chính: rút trích, chuyển đổi và nạp
Quá trình rút trích luôn bộc lộ những vấn đề về chất
lượng dữ liệu trong hệ thống tác nghiệp
Vấn đề chất lượng dữ liệu luôn cần phải được lưu ý trong
giai đoạn xây dựng trạm dữ liệu
Data Warehouse and Business Intelligence 24
4.7 Thiết kế kiến trúc kỹ thuật
KDL yêu cầu việc tích hợp của nhiều công nghệ
Những nhân tố then chốt cần xem xét:
Yêu cầu nghiệp vụ
Môi trường công nghệ hiện tại
Kỹ thuật chiến lược
Data Warehouse and Business Intelligence 25
4.8 Chọn lựa và cài đặt kết quả
Dùng các kiến trúc kỹ thuật như framework
Qui trình đánh giá tiêu chuẩn kỹ thuật đi theo những nhân
tố lượng giá cho mỗi thành phần kiến trúc được định
nghĩa
Sau chọn lựa và cài đặt, yêu cầu có quá trình kiểm tra để
chắc chắn việc tích hợp tương thích