TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM
KHOA CÔNG NGHỆ THÔNG TIN
Môn : Phát triển ứng dụng hệ thống
thông tin hiện đại
Giáo viên hướng dẫn:
Nguyễn Trần Minh Thư
Hồ Lê Thị Kim Nhung
Phạm Minh Tú
Thành viên nhóm 18:
Mã Kiếm Long – 1042062
Trần Thị Phụng – 1042088
Nguyễn Minh Tâm – 1042101
Phạm Văn Trung -1041156
Nguyễn Văn Trãi - 1042121
Chủ đề : Tìm hiểu về BI và công cụ mã nguồn mở Pentaho
•
Tìm hiểu về Data Warehouse
•
OLAP
•
BI(Business Intelligene)
•
Tìm hiểu công cụ mã nguồn mở Pentaho
hoạt động hay các xử lý giao dịch hàng ngày.
Cung cấp một khung nhìn đơn giản và súc tích xung quanh các sự kiện của các chủ đề.
Biến thời gian – Time Variant : Các dữ liệu được định nghĩa một thời điểm xác định và được ghi chép lại để phục vụ
cho việc so sánh dữ liệu theo thời gian.
Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệ thống tác
nghiệp.
Cơ sở dữ liệu tác nghiệp : dữ liệu có giá trị hiện thời.
Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử (ví dụ như, 5 – 10 năm trước).
Đặc điểm của Data Warehouse()
Bền vững - Non Volatile
Là một lưu trữ vật lý của dữ liệu được chuyển đổi từ môi trường tác nghiệp.
Cập nhật tác nghiệp của dữ liệu không xuất hiện trong môi trường kho dữ liệu.
Không yêu cầu các cơ chế xử lý giao dịch, phục hồi và điều khiển tương tranh.
Chỉ yếu cầu hai thao tác trong truy cập dữ liệu : Nạp và truy cập dữ liệu.
Cấu trúc của Data Warehouse ()
Một Data warehouse được cấu tạo từ một hay nhiều cube.
Ngày nay, hầu hết các data warehouse đang được dùng cho quản trị doanh nghiệp thông minh làm
tăng mối quan hệ khách hàng(CRM) và khai thác dữ liệu.
Một số được sử dụng để báo cáo tổng hợp.
Một số được sử dụng để tích hợp dữ liệu.
Các cách sử dụng này đều tương quan với nhau
OLAP
(Online Analy+cal Processing )
Trình bày : 1041156 Phạm Văn Trung
Khái niệm
So Sánh OLAP & OLTP
Các mô hình lưu trữ hỗ trợ OLAP
Kiến trúc khối Cube của OLAP
Mô hình kiến trúc dịch vụ OLAP
OlAP là một kỹ thuật sử dụng các thể hiện dữ liệu đa chiều gọi là các khối Cube nhằm cung cấp
khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu
!"#$%&
Cung cấp mô hình dữ liệu đa chiều trực quan cho phép dễ lựa chọn , định hướng và khám phá dữ liệu.
Cung cấp một ngôn ngữ truy vấn phân tích , cung cấp sức mạnh để khám phá các mối quan hệ trong
Cấu trúc này được lưu bên ngoài cơ sở dữ liệu data mark hoặc kho dữ liệu.
,'(,$%&
Mô hình dữ liệu MOLAP
,'(,$%&
Lưu trữ các khối (Cube) trong cấu trúc MOLAP là tốt nhất cho các truy vấn tổng hợp dữ liệu
thường xuyên mà cần thời gian hồi đáp nhanh.
Mô hình MOLAP cho phép thực thi và truy vấn dữ liệu tốt nhất .
,'(,$%&
Thông tin tổng hợp và dữ liệu cơ sở được lưu trữ trong cấu trúc đa chiều.
Những thao tác kết thì không cần thiết.
Sử dụng thuật toán nén dữ liệu.
Sử dụng chỉ mục bitmap.
Không sử dụng cơ chế khóa.
Có thể được nạp trước vào bộ nhớ cache .