Công nghệ xử lý phân tích trực tuyến trong việc trợ giúp quyết định - pdf 25

Link tải luận văn miễn phí cho ae Kết Nối

Tìm hiểu kho dữ liệu và công nghệ OLAP sử dụng để khai thác trên các kho dữ liệu. Nghiên cứu mô hình cơ sở dữ liệu đa chiều. Ứng dụng công nghệ phân tích trực tuyến vào khai thác, trợ giúp công tác quản lý, ra quyết định
Luận văn ThS. Công nghệ thông tin -- Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2003
Electronic Resources
Kiểu:text
Định dạng:text/pdf
Link tải Free download cho anh em Ket-noi:

CHƢƠNG I – KHO DỮ LIỆU
1. Khái niệm kho dữ liệu
1.1 Định nghĩa kho dữ liệu
1.2 Đặc điểm dữ liệu của kho dữ liệu
1.2.1 Dữ liệu hƣớng chuyên đề
1.2.2 Dữ liệu có tính tích hợp
1.2.3 Dữ liệu chỉ đọc, không biến động
1.2.4 Dữ liệu gắn với thời gian và có tính lịch sử
1.2.5 Dữ liệu tổng hợp và chi tiết
1.3 Kho dữ liệu và hệ xử lý giao dịch trực tuyến
1.3.1 Đặc điểm của hệ thống OLPT
1.3.2 Sự khác nhau giữa kho dữ liệu và OLTP
2. Kiến trúc và các thành phần cấu thành kho dữ liệu
2.1 Kiến trúc kho dữ liệu
2.1.1 Kiến trúc kho dữ liệu cơ bản
2.1.2 Kiến trúc kho dữ liệu với vùng tạm
2.1.3 Kiến trúc kho dữ liệu với vùng tạm và dữ liệu chuyên đề
2.2 Các thành phần cấu thành kho dữ liệu
2.2.1 Các dữ liệu nguồn
2.2.2 Công cụ thu thập, làm sạch và chuyển đổi dữ liệu nguồn
2.2.3 Kho dữ liệu
2.2.4 Kho dữ liệu chuyên đề
2.2.5 Phân tích và truy cập của ngƣời sử dụng cuối
2.2.6 Siêu dữ liệu
3. Sử dụng kho dữ liệu
4. Thiết kế và xây dựng kho dữ liệu
4.1 Thiết kế logic cho kho dữ liệu
4.1.1 Lƣợc đồ hình sao
4.1.2 Lƣợc đồ hình tuyết rơi
4.1.3 Lƣợc đồ kết hợp
4.2 Thiết kế vật lý kho dữ liệu 4.2.1 Phân hoạch dữ liệu và cơ chế song song
4.2.2 Thiết kế khung nhìn và chỉ số cho kho dữ liệu vật lý
CHƢƠNG II – MÔ HÌNH DỮ LIỆU CHO XỬ LÝ PHÂN TÍCH TRỰC TUYẾN
1. Mô hình dữ liệu đa chiều
1.1 Các khái niệm về chiều
1.2 Độ đo
1.3 Khối dữ liệu
1.4 Các phép toán trong mô hình đa chiều
2. Các dạng chuẩn của CSDL đa chiều
2.1 Xây dựng lại theo logic của thiết kế lƣợc đồ đa chiều
2.1.1 Phân lớp
2.1.2 Mô tả tiềm năng và dị biệt
2.1.3 Dạng chuẩn logic
2.2 Khuôn mẫu cho mô hình hoá đa chiều
2.3 Dạng chuẩn đa chiều giới hạn
2.3.1 Các chiều
2.3.2 Sử dụng phụ thuộc hàm cho phân cấp
2.3.3 Loại bỏ các phụ thuộc hàm yếu cho tổng hợp
2.3.4 Dạng chuẩn chiều
2.3.5 Dạng chuẩn đa chiều
2.4 Dạng chuẩn đa chiều tổng quát
2.4.1 Phân biệt các thuộc tính chiều
2.4.2 Ngữ cảnh hợp lệ
2.4.3 Dạng chuẩn đa chiều tổng quát (GMNF)
CHƢƠNG III – CÔNG NGHỆ XỬ LÝ PHÂN TÍCH TRỰC TUYẾN TRONG
VIỆC TRỢ GIÚP QUYẾT ĐỊNH
1. Công nghệ xử lý phân tích trực tuyến
1.1 Định nghĩa OLAP
1.2 Đặc điểm cơ bản của OLAP
1.3 Kiến trúc của OLAP
2. Công nghệ lƣu trữ dữ liệu cho OLAP
2.1 Kho dữ liệu đa chiều
2.2 Kho dữ liệu quan hệ (ROLAP)
2.3 Kho dữ liệu lai
3. Lựa chọn chỉ số cho OLAP
3.1 Khối dữ liệu con
3.2 Truy vấn
3.3 Chỉ số
3.4 Quan hệ tính toán và phụ thuộc
3.5 Mô hình chi phí
3.6 Thuật toán chọn khung nhìn với các chỉ số 4. Ứng dụng công nghệ OLAP trong hỗ trợ quyết định
4.1 Lợi ích của OLAP
4.2 Các mô hình ứng dụng OLAP
4.2.1 Tạo báo cáo và truy vấn đặc biệt
4.2.2 Các hệ thống thông tin điều hành - EIS
4.2.3 Phân tích đa chiều
4.2.4 Phân tích theo kịch bản (chuỗi sự kiện)
4.2.5 Khai phá dữ liệu
CHƢƠNG IV – ỨNG DỤNG CÔNG NGHỆ OLAP TRONG TRỢ GIÚP QUYẾT
ĐỊNH
1. Giới thiệu hệ thống ứng dụng
1.1 Mục tiêu xây dựng hệ thống
1.2 Giới thiệu bài toán
1.3 Giới thiệu công cụ khai thác kho dữ liệu của Oracle
2. Một số minh họa
KẾT LUẬN
1. Những kết quả đạt đƣợc
2. Những hạn chế
3. Hƣớng phát triển
DANH MỤC TÀI LIỆU THAM KHẢO 1. Đặt vấn đề
Trong bối cảnh công nghệ thông tin phát triển mạnh mẽ, dữ liệu ngày càng đƣợc
tập trung trong những cơ sở dữ liệu (CSDL) khổng lồ, nhu cầu truy nhập vào tất cả
các dữ liệu để lấy ra thông tin là cần thiết. Cách tổ chức dữ liệu có hiệu quả nhất để
trợ giúp nhu cầu truy nhập tìm ra thông tin cần thiết là kho dữ liệu.
Ở nƣớc ta ngày càng có nhiều kho dữ liệu đƣợc xây dựng và lƣợng dữ liệu ngày
một lớn. Nhƣng việc khai thác hiện nay chƣa có hiệu quả, vì trong kho dữ liệu lớn,
đa chiều thƣờng chứa nhiều thông tin (tri thức) ẩn kín mà các công cụ truyền thống
nhƣ kỹ thuật truy vấn SQL rất khó và nhiều khi không phát hiện đƣợc. Hơn thế nữa,
do yêu cầu của ngƣời sử dụng liên tục thay đổi, đòi hỏi các câu trả lời phải theo thứ
tự khác nhau.
Yêu cầu làm thể nào có thể khai thác thông tin có hiệu quả, thoả mãn nhu cầu
khai thác mức cao của ngƣời dùng, đòi hỏi phải có công nghệ khai thác thích hợp,
hiện nay xử lý phân tích trực tuyến (OLAP) là một trong các phƣơng pháp khai thác
có hiệu quả trên những tập dữ liệu lớn và hỗn hợp. Trƣớc đây công nghệ này ít
đƣợc áp dụng vì nó đắt tiền, khó cài đặt, không mềm dẻo trong khai thác. Nhƣng
đến nay trên thế giới công nghệ OLAP thực sự đã và đang đƣợc nghiên cứu, phát
triển mạnh mẽ và ngày càng đuợc sử dụng rộng rãi trong khai thác dữ liệu, hỗ trợ ra
quyết định. Ở nƣớc ta việc áp dụng công nghệ này đến nay vẫn chƣa đƣợc phát
triển.
Xuất phát từ nhu cầu thực tiễn tui chọn hƣớng đề tài nghiên cứu: “Công nghệ xử
lý phân tích trực tuyến trong việc trợ giúp quyết định” nhằm tìm hiểu về kho dữ
liệu và công nghệ OLAP sử dụng để khai thác trên các kho dữ liệu, hƣớng tới xây
dựng các hệ thống có khả năng ứng dụng công nghệ phân tích trực tuyến vào khai
thác dữ liệu phục vụ cho công tác quản lý, hỗ trợ ra quyết định.
2. Mục tiêu của đề tài
Đề tài đề cập đến việc nghiên cứu nhằm hƣớng đến xây dựng các hệ thống trợ
giúp quyết định sử dụng phƣơng pháp luận OLAP. Luận văn sẽ tập trung vào các
công việc chính là nghiên cứu vấn đề tổ chức, xây dựng kho dữ liệu, nhấn mạnh vào
nghiên cứu mô hình CSDL đa chiều và phân tích dữ liệu trực tuyến để trợ giúp ra
quyết định. Hệ trợ giúp quyết định theo tiếp cận này, có thể giúp cho nhà quản lý thiết lập
một mô hình OLAP cho ứng công cụ thể của mình trong việc tổ chức CSDL đa
chiều, và giúp cho họ dễ dàng trong hoạt động phân tích, tìm kiếm thông tin theo
những khía cạnh khác nhau của dữ liệu, nhằm thu thập đƣợc tối đa những gì họ cần
hiểu rõ, để từ đó có thể ra đƣợc những quyết định tốt nhất một cách nhanh chóng.
Không giống với các hệ trợ giúp quyết định truyền thống thƣờng đƣợc xây dựng với
mục đích đƣa ra giải pháp tối ƣu cho một bài toán cụ thể, trong một phạm vi ứng
dụng hẹp, công nghệ OLAP hƣớng đến việc giúp ngƣời sử dụng có thể khai thác
đƣợc tối đa khả năng tiềm ẩn của một khối lƣợng dữ liệu lớn, nhằm thu đƣợc những
thông tin tổng hợp ở đủ các khía cạnh khác nhau của dữ liệu, để từ đó có thể ra các
quyết định một cách nhanh chóng. Do đặc điểm này, phạm vi ứng dụng của hệ trợ
giúp quyết định sử dụng công nghệ OLAP dựa vào dữ liệu là rộng rãi cho các bài
toán khác nhau, trong nhiều lĩnh vực khác nhau.
3. Bố cục của luận văn
Nội dung của luận văn đƣợc chia thành bốn chƣơng:
Chương 1: Nội dung chủ yếu giới thiệu lý thuyết chung về kho dữ liệu - phƣơng
pháp tổ chức, thiết kế CSDL và xây dựng kho dữ liệu. Nhấn mạnh trong việc thiết
kế CSDL vật lý của kho dữ liệu bằng việc sử dụng thuật toán A* và các luật của
Thumb để chọn khung nhìn và chỉ số tối ƣu việc bảo trì kho dữ liệu.
Chương 2: Trình bày về mô hình dữ liệu đa chiều và các dạng chuẩn dữ liệu đa
chiều trong mô hình CSDL đa chiều sử dụng trong OLAP.
Chương 3: Trình bày những lý thuyết cơ bản về công nghệ OLAP trong việc hỗ
trợ ra quyết định, cách tổ chức lƣu trữ dữ liệu, việc chỉ số hóa khung nhìn để tối ƣu
tốc độ truy vấn.
Chương 4: Xây dựng một ứng dụng sử dụng các công cụ và công nghệ của
Oracle nhằm mô tả cho việc ứng dụng công nghệ OLAP trong việc hỗ trợ ra quyết
định. CHƢƠNG I – KHO DỮ LIỆU
Các doanh nghiệp, tổ chức kinh tế - xã hội đều đang phải đối đầu với sự thay đổi
của thị trƣờng, sự thay đổi hoàn thiện của các chính sách kinh tế xã hội. Để có thể
đƣa ra một quyết định đúng đắn, trƣớc hết phải có khả năng nhanh chóng truy nhập
đƣợc tới các thông tin mà doanh nghiệp, tổ chức có sẵn. Đối với một doanh nghiệp,
tổ chức, muốn có một quyết định đúng đắn, cần nghiên cứu cả những dữ liệu trong
quá khứ và hiện tại, nhằm phân tích và xác định ra các xu hƣớng có thể ở hiện tại và
tƣơng lai. Để phục vụ phân tích dữ liệu cần đƣợc tập trung lại và do đó sẽ tạo ra
những CSDL khổng lồ. Cách tổ chức dữ liệu có hiệu quả nhất để trợ giúp nhu cầu
truy nhập thông tin hỗ trợ ra quyết định là tổ chức thành các kho dữ liệu.
1. Khái niệm kho dữ liệu
1.1 Định nghĩa kho dữ liệu
Kho dữ liệu (Data warehouse-DW) là một tập hợp các CSDL tích hợp, hướng
chuyên đề, được thiết kế cho việc truy vấn và phân tích hơn là xử lý giao dịch để hỗ
trợ cho chức năng trợ giúp quyết định, mà mỗi đơn vị dữ liệu đều liên quan tới một
khoảng thời gian cụ thể [2].
Kích thƣớc của kho dữ liệu thƣờng rất lớn, đƣợc tổ chức, lƣu trữ và phân tích
phục vụ cho việc cung cấp các thông tin liên quan đến nghiệp vụ của tổ chức. Kho
dữ liệu phục vụ cho việc phân tích với kết quả mang tính thông tin cao. Các hệ
thống thông tin thu thập, xử lý dữ liệu loại này còn gọi là hệ xử lý phân tích trực
tuyến - OLAP.
Một kho lƣu trữ dữ liệu thƣờng đƣợc sử dụng nhƣ là các thông tin cơ sở cho một
hệ thống hỗ trợ quyết định. Nó đƣợc thiết kế để khắc phục những vấn đề vấp phải
khi một doanh nghiệp hay tổ chức cố gắng thực hiện chiến lƣợc phân tích có sử
dụng cùng CSDL mà đƣợc sử dụng cho xử lý giao dịch trực tuyến - OLTP
1.2 Đặc điểm dữ liệu của kho dữ liệu
1.2.1 Dữ liệu hướng chuyên đề
Kho dữ liệu đƣợc thiết kế để giúp cho việc phân tích dữ liệu. Ví dụ để biết nhiều
hơn về dữ liệu bán hàng của tổ chức, doanh nghiệp có thể xây dựng một kho dữ liệu
tập trung vào chuyên đề bán hàng. Sử dụng kho dữ liệu này có thể trả lời đƣợc các


Bc0rp95NONpYw01
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status