Xây dựng hệ thống trợ giúp ra quyết định phục vụ công tác quản lý các đề tài nghiên cứu khoa học và công nghệ của các đơn vị trực thuộc Bộ Khoa học và Công nghệ - Pdf 30



ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÙI THỊ LIÊN HƯƠNG
XÂY DỰNG HỆ THỐNG TRỢ GIÚP RA QUYẾT ĐỊNH PHỤC
VỤ CÔNG TÁC QUẢN LÝ CÁC ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CỦA CÁC ĐƠN VỊ TRỰC
THUỘC BỘ KHOA HỌC VÀ CÔNG NGHỆ LUẬN VĂN THẠC SĨ Hà Nội - 2010

1.2.4. Siêu dữ liệu (Meta Data) 21
1.2.5. Cấu trúc kho dữ liệu 21
1.2.6. Các mô hình kho dữ liệu 23
1.2.7. Các bước thiết kế kho dữ liệu 24
1.3. Xử lý dữ liệu trực tuyến (OLAP) 25
1.3.1. Lý do sử dụng OLAP 25
1.3.2. Kiến trúc vật lý 26
1.3.3. Phương pháp thiết kế 27
1.3.4. Thực hiện truy vấn và thiết kế khung nhìn (Materialized View) 28
1.3.5. Các phép toán OLAP trong mô hình dữ liệu nhiều chiều 29
1.4. Kết luận 31
3
&CN 32
2.1. Giới thiệu chung về hệ thống 32
2.2. Phƣơng pháp luận và công cụ 33
2.2.1. Phương pháp luận chung 33
2.2.2. Phân tích có cấu trúc 33
2.2.3. Hai mô hình phân tích hệ thống có cấu trúc 34
2.2.4. Phương pháp luận xây dựng kho dữ liệu 34
2.2.5. Công cụ thực hiện 35
2.2.6. Bộ công cụ Microsoft SQL Server 2005 36
2.3. Phân tích, thiết kế hệ thống 36
2.3.1. Những yêu cầu chung về hệ thống 36
2.3.2. Thiết kế cơ sở dữ liệu 37
2.3.3. Xây dựng mô hình cấu trúc cơ sở dữ liệu 40
2.3.4. 40
2.4. Kết luận 41
5
DANH MỤC CÁC TỪ VIẾT TẮT Tên khoa học
Tên viết tắt
Giải nghĩa

CNTT
Công nghệ thông tin

CNTT & TT
Công nghệ thông tin và
truyền thông

KH&CN
Khoa học và Công nghệ
Database
CSDL
Cơ sở dữ liệu
Data warehouse
DW
Kho dữ liệu
Decision Support System
DSS
Hệ trợ giúp ra quyết định
Metadata


3. Hình 1.2.3. Sơ đồ tuyết rơi
4. Hình 1.3.1. Các phép toán OLAP
5. Hình 2.3.1. Sơ đồ quan hệ thông tin đề tài nghiên cứu khoa học
6. Hình 3.2.1. Tiến trình trợ giúp
7. Hình 3.2.2. Mô hình dữ liệu đa chiều
8. Hình 3.2.3. Mô hình dữ liệu khối
9. Hình 4.1.2. Sơ đồ chi tiết cài đặt hệ thống
10. Hình 4.3.1. Tạo một Analysis Services Project mới
11. Hình 4.3.2. Xác định dữ liệu nguồn
12. Hình 4.3.3. Chọn dữ liệu để xử lý
13. Hình 4.3.4. Xác định bảng sự kiện và bảng chiều
14. Hình 4.3.5. Lựa chọn đơn vị đo
15. Hình 4.3.6. Phân tích và hiển thị dữ liệu của khối

8
MỞ ĐẦU

1. Lý do chọn đề tài:
Sự phát triển vượt bậc và không ngừng đổi mới của ngành CNTT&TT đã
và đang tác động mạnh mẽ, sâu sắc và toàn diện đến mọi mặt trong đời sống
chính trị, kinh tế, văn hóa, xã hội trên toàn thế giới. Cuộc cách mạng KH&CN
này đã và đang tạo ra cơ hội cho những biến đổi cơ bản và những thành công to
lớn của các nước trên thế giới. Trong vài thập kỷ gần đây, nhiều nước trên thế
giới đã nắm bắt được cơ hội ứng dụng CNTT&TT, tận dụng thế mạnh của nó để
thúc đẩy phát triển kinh tế-xã hội, tạo ra những bước đột phá, đưa đất nước tiến
mạnh lên phía trước.
Để hội nhập với xu thế phát triển chung của thế giới và các nước trong

2005), Nghị định 64/2007/NĐ-CP về ứng dụng CNTT trong hoạt động của cơ
quan nhà nước, Quyết định số 43/2008/QĐ-TTg về việc phê duyệt kế hoạch ứng
dụng CNTT trong hoạt động của cơ quan nhà nước năm 2008 và gần đây nhất là
Quyết định số 48/2009/QĐ-TTg về việc phê duyệt kế hoạch ứng dụng CNTT
trong hoạt động của cơ quan nhà nước giai đoạn 2009-2010. Tuy đã đạt được
một số kết quả nhất định nhưng vẫn còn tồn tại nhiều vấn đề bất cập cần giải
quyết trong việc triển khai các ứng dụng CNTT phục vụ công tác quản lý nhà
nước của Bộ KH&CN, đặc biệt là tổ chức quản lý các chương trình, đề tài
nghiên cứu khoa học. Cho đến nay, Bộ KH&CN vẫn chưa xây dựng được “Hệ
thống trợ giúp ra quyết định hỗ trợ công tác quản lý các chương trình, đề tài
nghiên cứu khoa học” để tạo ra một công cụ đảm bảo việc cung cấp thông tin
đầy đủ, kịp thời và chính xác, nâng cao một bước hiệu quả công tác quản lý nhà
nước về hoạt động nghiên cứu KH&CN theo hướng hình thành Bộ KH&CN
điện tử (e-MOST), góp phần đưa KH&CN trở thành động lực thúc đẩy phát triển
kinh tế-xã hội. Do vậy, việc nghiên cứu xây dựng “Hệ thống trợ giúp ra quyết
định hỗ trợ công tác quản lý chương trình, đề tài nghiên cứu khoa học” để hỗ trợ
việc lựa chọn tổ chức và cá nhân chủ trì thực hiện các nhiệm vụ KH&CN phù
hợp, góp phần nâng cao năng lực quản lý các nhiệm vụ nghiên cứu triển khai
của Bộ và gắn kết hoạt động nghiên cứu khoa học với thực tiễn sản xuất đang là
một nhu cầu rất cấp thiết hiện nay.
2. Tổng quan tình hình nghiên cứu:
Chính phủ của nhiều nước trên thế giới đã triển khai xây dựng các hệ
thống thông tin điện tử phục vụ công tác quản lý từ những năm 1980. Từ những
năm 1990, mạng Internet phát triển thành xa lộ thông tin toàn cầu, nhiều nước
trên thế giới đang phát triển mạnh xu hướng tích hợp các cơ sở dữ liệu (CSDL)
để xây dựng các hệ thống hỗ trợ ra quyết định nhằm đáp ứng các yêu cầu thống
nhất nội dung thông tin và trao đổi dữ liệu trên diện rộng. Các hệ thống hỗ trợ ra
quyết định này đã và đang được áp dụng ở nhiều nước có nền công nghiệp
CNTT phát triển như: Mỹ, Canada, Đức, Anh, Pháp, Ấn Độ, Hàn Quốc,
Singapore và hoạt động rất hiệu quả trong các lĩnh vực an ninh quốc phòng,

Bộ KH&CN liên quan đến công tác quản lý các nhiệm vụ KH&CN phần lớn
được quản lý và lưu trữ trên phần mềm MS Access, chạy độc lập trên các máy
trạm theo nhu cầu của từng đơn vị và chưa thống nhất về cấu trúc dữ liệu cũng
như không có tiêu chuẩn về thông tin và không được cập nhật thường xuyên. Do
vậy, các thông tin của các CSDL này hầu như không được chia sẻ và hiệu quả
rất hạn chế.
Chính vì vậy, việc xây dựng hệ thống thông tin tích hợp phục vụ công tác
quản lý nhà nước về KH&CN đang là một trong các nhiệm vụ trọng tâm, ưu tiên
của Bộ KH&CN trong giai đoạn hiện nay. Đặc biệt là ứng dụng CNTT để xây
dựng hệ thống CSDL tích hợp phục vụ công tác quản lý, thống kê các nhiệm vụ
KH&CN của Bộ, hỗ trợ công tác xây dựng kế hoạch và quản lý hoạt động
nghiên cứu và phát triển KH&CN. Hệ thống thông tin này không những phải
đáp ứng tốt yêu cầu quản lý các nhiệm vụ KH&CN mà còn hỗ trợ công tác tư
vấn ra quyết định giao chỉ tiêu kế hoạch hàng năm, lựa chọn tổ chức và cá nhân
chủ trì thực hiện nhiệm vụ KH&CN đồng thời sẽ góp phần nâng cao năng lực
11
quản lý các nhiệm vụ nghiên cứu triển khai của Bộ KH&CN. Hệ thống trợ giúp
ra quyết định này cần được thiết kế và xây dựng dựa trên các công cụ phát triển
phần mềm tiên tiến, phù hợp với xu thế ứng dụng CNTT hiện nay trên thế giới;
sử dụng công cụ phát triển phần mềm trên web là ASP.NET và CSDL tích hợp
được quản lý, lưu trữ trên cơ sở hệ quản trị dữ liệu MS SQL Server với hệ thống
bảo mật thông tin cao. Hệ thống trợ giúp ra quyết định cần được xây dựng trên
cơ sở khai phá dữ liệu trong các CSDL quản lý các đề tài nghiên cứu KH&CN
đã có sẵn tại Bộ KH&CN. Hệ thống có khả năng phân tích dữ liệu theo yêu cầu
truy vấn trực tiếp hoặc theo các kịch bản có sẵn để cung cấp cho các nhà quản lý
các thông tin đầy đủ về cơ quan và cá nhân chủ trì, về quá trình phê duyệt nhiệm
vụ, về tiến độ triển khai thực hiện, về các kết quả và kinh phí… của các chương

khai thực hiện các đề tài và lựa chọn đề tài nghiên cứu KH&CN hàng năm.
Cài đặt và đánh giá kết quả thử nghiệm chương trình hỗ trợ công tác quản
lý các chương trình, đề tài nghiên cứu khoa học tại Bộ KH&CN.
5. Mẫu khảo sát:
Các đơn vị trực thuộc Bộ KH&CN.
Kết quả triển khai dự án Tin học hóa quản lý nhà nước tại một số Bộ,
ngành Trung ương.
6. Vấn đề nghiên cứu:
Hiện trạng ứng dụng CNTT trong công tác quản lý các nhiệm vụ nghiên
cứu và phát triển của Bộ KH&CN hiện nay như thế nào?
H thống (Decision Support System) và các giải pháp
xây dựng CSDL tích hợp của hệ thống, hình thành kho dữ liệu, tối ưu hóa
như thế nào?
công tác
nghiên cứu khoa học &CN thế nào là phù hợp?
7. Giả thuyết nghiên cứu:
Hiện trạng phát triển ứng dụng CNTT phục vụ công tác quản lý tại Bộ
KH&CN:
Hạ tầng cơ sở kỹ thuật có khả năng đáp ứng cơ bản cho việc triển khai các
dự án ứng dụng CNTT phục vụ công tác quản lý. Một số ứng dụng CNTT đã
được triển khai thực hiện phục vụ công tác quản lý, chỉ đạo, điều hành của Lãnh
đạo Bộ cũng như chuyên môn, nghiệp vụ của chuyên viên. Một số dịch vụ công
đã được xây dựng tuy mới ở mức sơ khai. Nhận thức của cán bộ, công chức về
vai trò và tác dụng của CNTT được nâng cao Tuy nhiên, việc ứng dụng CNTT
để nâng cao năng lực điều hành, quản lý, phục vụ người dân và doanh nghiệp tại
Bộ KH&CN chưa thực sự hiệu quả, chưa đạt mục tiêu đề ra do Chính phủ quy
định.
H thống và các giải pháp xây dựng kho dữ liệu,
:


sẽ được sử dụng:
Phương pháp nghiên cứu tài liệu: Thu thập và nghiên cứu các tài liệu liên
quan về kết quả triển khai ứng dụng CNTT vào công tác quản lý nhà nước, các
bài báo khoa học, các văn bản quy phạm pháp luật liên quan.
14
Phương pháp điều tra: Để xác định thực trạng việc ứng dụng CNTT trong
công tác quản lý nhà nước tại Bộ KH&CN, đề tài đã tiến hành điều tra khảo sát
29 đơn vị trực thuộc Bộ KH&CN thuộc các khối quản lý nhà nước và đơn vị sự
nghiệp.
Phương pháp thiết kế hệ thống: Thiết kế và xây dựng hệ thống trợ giúp ra
quyết định hỗ trợ công tác quản lý các chương trình, đề tài nghiên cứu khoa học
9. Kết cấu luận văn:
Kết cấu của bản Luận văn gồm những nội dung chính sau:
Mở đầu;
Chương 1: Tổng quan;
Chương 2: Phân tích, thiết kế hệ thống trợ giúp ra quyết định hỗ trợ quản
lý hoạt động KH&CN;
Chương 3: Xây dựng kho dữ liệu và giải pháp xử lý phân tích trực tuyến;
Chương 4: Trích, chọn, nạp và xử lý dữ liệu;
Kết luận;
Tài liệu tham khảo.

15
CHƢƠNG 1. TỔNG QUAN

gửi đi kiểm tra. Sau khi hệ thống xem xét các thông tin của người ra quyết định
gửi đến sẽ sửa đổi, bổ sung và gửi lại để người ra quyết định kiểm tra lần nữa.
Quá trình trên sẽ lại được bắt đầu lại từ đầu cho tới khi đưa ra được các giải
pháp thống nhất.
16
Daniel Power cũng có cách phân loại khác cho hệ hỗ trợ quyết định. Sử
dụng mô hình trợ giúp như tiêu chuẩn phân loại, Power phân chia hệ hỗ trợ
quyết định thành hệ hỗ trợ quyết định hướng giao tiếp, hệ hỗ trợ quyết định
hướng tài liệu, hệ hỗ trợ quyết định hướng tri thức và hệ hỗ trợ quyết định
hướng mô hình:
- Hệ hỗ trợ quyết định hướng mô hình (Model-driven DSS) tập trung vào
truy nhập và thao tác trên mô hình thống kê, tài chính, tối ưu hoặc mô phỏng. Hệ
hỗ trợ quyết định hướng mô hình sử dụng dữ liệu và các tham số do người dùng
cung cấp để trợ giúp cho người ra quyết định trong việc phân tích tình huống, hệ
thống này không cần phải có nhiều dữ liệu.
- Hệ hỗ trợ quyết định hướng giao tiếp (Communication-driven DSS) hỗ trợ
trong trường hợp nhiều người cùng làm 1 công việc, trong đó sử dụng các công
cụ tích hợp như Microsoft's NetMeeting hay Groove.
- Hệ hỗ trợ quyết định hướng dữ liệu (Data-driven DSS hay Data-oriented
DSS) tập trung vào truy nhập và thao tác trên dẫy dữ liệu nội bộ của công ty
hoặc đôi khi là dữ liệu bên ngoài.
- Hệ hỗ trợ quyết định hướng tài liệu (Document-driven DSS) quản lý, hiển
thị và thao tác trên thông tin phi cấu trúc dưới các định dạng điện tử khác nhau
- Hệ hỗ trợ quyết định hướng tri thức (Knowledge-driven DSS) cung cấp
kinh nghiệp giải quyết vấn đề chuyên sâu đã được lưu trữ trong hệ thống như
các sự kiện, các luật, thủ tục hoặc các cấu trúc tương tự.
Sử dụng phạm vi như tiêu chuẩn phân loại, Power cũng phân hệ hỗ trợ quyết

(c) Máy tri thức
(d) Giao diện người dùng
(e) Người dùng
1.2. Kho dữ liệu (DW)
1.2.1. Dữ liệu tác nghiệp
Hệ thống OLTP cho phép các giao dịch thay đổi dữ liệu trong bảng (ví dụ
bằng các lệnh insert, update, delete, join ) trong quá trình xử lý. Hệ thống cho
phép nhiều ứng dụng truy cập dữ liệu cùng một thời gian.
Các ứng dụng trên client bao gồm tất cả các loại ứng dụng như ngân hàng,
bán vé trực tuyến, bán vé hàng không, thanh toán cước phí Sử dụng hệ thống
OLTP có các ưu điểm sau:
- Xử lý các tương tác.
- Dễ bảo trì và khống chế dữ liệu thừa.
- Thiết lập dữ liệu quan hệ trọn vẹn.
- Tính hiệu quả cao.
- Giảm thời gian của khách hàng.
Các CSDL trong các hệ OLTP thường được thiết kế thoả mãn 3NF (Third
Normal Form) hoặc tốt hơn. Đặc điểm của hệ thống OLTP là nó lưu trữ các dữ
liệu "thô", có nghĩa là mức độ tổng quát, trừu tượng của dữ liệu này rất thấp. Nói
cách khác OLPT rất có ích để tìm trả lời những câu truy vấn dạng: Tổng sản
18
lượng sản phẩm X do công ty bán được trong 6 tháng đầu năm, mặt hàng nào
bán chạy nhất tại địa phương Y trong tháng vừa qua Trong khi đó các nhà
quản lý ở mức cao của công ty rất ít khi quan tâm đến những câu hỏi loại đó.
Điều họ cần chú ý là những câu hỏi trừu tượng hơn như: Tiêu thụ A tại B đang
giảm, nếu thay đổi 3%-5% giá của sản phẩm A tại khu vực B, tình trạng tiêu thụ
sẽ thay đổi ra sao trong 6 tháng cuối năm và tại sao?


19
1.2.2. Khái niệm về kho dữ liệu
Là một cách tiếp cận do B.Inmon đề xướng vào những năm 90 của thế kỷ
trước. Đây là sự kết hợp của một số giải pháp kỹ thuật và được đặt tên là Data
Warehoushing - kỹ thuật xây dựng các kho dữ liệu. Kho dữ liệu được định nghĩa
như một tập hợp các phương tiện cho phép hình dung dữ liệu một cách tổng thể,
hướng đối tượng để giúp cho việc phân tích và ra quyết định.
Những người đầu tiên đưa ra ý tưởng về kho dữ liệu xác định rằng tiến hành
phân tích trực tiếp trên dữ liệu của các hệ xử lý giao dịch không hiệu quả. Các
dữ liệu từ một vài OLTP cần phải được biến đổi và sau đó đưa vào một nơi lưu
trữ dữ liệu duy nhất. Quá trình này được gọi là đưa dữ liệu vào kho dữ liệu, gồm
các công đoạn chính sau:
- Làm sạch (Bỏ các dữ liệu không cần thiết hoặc quá chuyên dụng)
- Liên kết các số liệu (tính trước số liệu tích, tổng, trung bình )
- Biến đổi dữ liệu: số liệu được biến đổi thành dạng thích hợp, tổ chức lại
phù hợp với kho dữ liệu
- Tích hợp số liệu từ các nguồn khác nhau.
- Đồng bộ hoá số liệu ở một thời điểm xác định.
Kho dữ liệu cũng là hệ thống dữ liệu đã được chuẩn bị để xây dựng hệ hỗ trợ
quyết định (DSS-Decision Support Systems) và hệ phân tích trực tuyến (OLAP-
Online Analysis Processing) do dữ liệu trong đó thoả mãn tính chất toàn vẹn và
có sự liên kết nội tại: Mặc dù dữ liệu được cung cấp từ nhiều OLTP, chúng được
liên kết bằng sự thống nhất trong quy tắc đặt tên, đơn vị đo, hệ thống các thuộc
tính chung Điều này có giá trị đặc biệt khi vận hành một lúc vài hệ thống,
trong đó các dữ liệu được biểu diễn bằng những đơn vị khác nhau (ví dụ như các
cách biểu diễn ngày, tháng khác nhau hoặc biểu diễn logic khác nhau). Các chỉ
số quan trọng như tổng số, giá trị trung bình trong các giai đoạn khác nhau,
trung bình cộng cũng được biểu diễn rất đa dạng ở các hệ khác nhau. Khi đưa
số liệu vào kho dữ liệu, mọi chỉ số không tương thích được chuyển đổi, tránh

được đưa vào kho dữ liệu để hạn chế dữ liệu cần xem xét xuống mức tối thiểu
nhưng cũng bảo đảm các thông tin theo từng vùng chủ đề (Subject area).
- Số liệu có tính lịch sử: Dữ liệu của hàng chục năm được lưu trữ nhằm phát
hiện sự liên hệ của các yếu tố có thể ảnh hưởng đến những chỉ tiêu cần quan tâm
trong một thời gian dài.
- Số liệu chỉ đọc: Dữ liệu đưa vào kho dữ liệu chỉ để đọc, việc sửa dữ liệu
hầu như không được tiến hành do nó có thể dẫn đến phá vỡ sự toàn vẹn. Thông
thường người ta không yêu cầu giảm thời gian đưa dữ liệu vào kho dữ liệu tới
mức tối thiểu, nhưng cần tối ưu hoá kho dữ liệu sao cho các truy vấn phục vụ
cho việc phân tích đạt tốc độ tốt nhất. Các sơ đồ quan hệ sẽ tạo ra các Index hợp
lý cũng như tạo ra sẵn các dữ liệu kết hợp.
- Số liệu không biến động: Thông tin trong kho dữ liệu được tải vào sau khi
dữ liệu trong hệ thống điều hành được cho là quá cũ. Không biến động thể hiện
ở chỗ: Dữ liệu được lưu trữ lâu dài trong kho dữ liệu. Mặc dù có thêm dữ liệu
mới nhập vào nhưng dữ liệu cũ trong kho vẫn không bị xoá, điều đó cho phép
21
cung cấp thông tin về một khoảng thời gian dài, cung cấp đủ số liệu cần thiết
cho các mô hình nghiệp vụ phân tích, dự báo.
1.2.4. Siêu dữ liệu (Meta Data)
Dữ liệu meta là dữ liệu của dữ liệu. Dữ liệu meta sử dụng cho quản lý tên dữ
liệu, định nghĩa dữ liệu của kho dữ liệu. Thư mục về dữ liệu meta gồm có :
- Mô tả về cấu trúc của kho dữ liệu, gồm lược đồ kho dữ liệu, chiều, phân
cấp và định nghĩa dữ liệu, cũng như vị trí và nội dung kho dữ liệu chuyên đề;
- Dữ liệu meta tác nghiệp, gồm nguồn gốc dữ liệu, lịch sử dữ liệu di cư, dãy
các phép chuyển hóa…, dữ liệu hiện tại gồm dữ liệu động, tư liệu và thông tin
giám sát gồm các thống kê, báo cáo sai, dãy kiểm toán;
- Các thuật toán dùng để tóm tắt, gồm thuật toán đo và xác định chiều, phân


Hình 1.2.1 Cấu trúc kho dữ liệu

Các khối bao gồm:
- Khối các nguồn dữ liệu
- Khối tạo dựng kho dữ liệu
- Khối tạo dựng kho dữ liệu cục bộ
- Khối truy nhập và sử dụng
Các lớp được chia thành
- Lớp quản lý dữ liệu
- Lớp quản lý siêu dữ liệu
- Lớp chuyển tải dữ liệu
- Lớp kết cấu hạ tầng
Việc nắm vững cấu trúc khối và lớp cho phép ta linh hoạt trong việc triển
khai các hệ thống kho dữ liệu trên thực tế. Tuỳ nhu cầu và khả năng tài chính,
chúng ta có thể xuất phát từ việc xây dựng các kho dữ liệu cục bộ (các
Datamart) trước để có thể khai thác ngay số liệu theo từng chủ đề. Một cách xây
dựng khác là tổ chức kho dữ liệu tổng thể trước, sau đó sẽ tổ chức các Datamart.
Mỗi phương án đều có những ưu điểm và nhược điểm riêng. Trên thực tế, tuỳ
điều kiện cụ thể, chúng ta có thể chọn giải pháp triển khai thích hợp.
Ngoài ra, các kho dữ liệu trên từng lĩnh vực khác nhau cũng có nhiều đặc

Bảng chiều
Chi nhánh
Bảng chiều
hàng#
tên
loại
mác
cung cấp
Hàng
Bảng chiều
địa điểm#
tỉnh
huyện
Địa điểm
Bảng chiều
thời gian#
chi nhánh#
hàng#
địa điểm#
tiền
số l-ợng
Bán hàng
Bảng sự kiện

Hỡnh 1.2.2 S hỡnh sao

S hỡnh sao ci thin ỏng k thi gian truy vn, cho phộp thc hin mt
s tớnh nng a chiu, rt trc quan, d s dng.
Khoỏ ca bng s kin c to bi cỏc khoỏ ca cỏc bng chiu. Tt c cỏc
khoỏ u c xỏc nh vi cựng mt tiờu chun t tờn.

loại
mác
nhà cung cấp#
Hàng
Bảng chiều
địa điểm#
tỉnh#
Địa điểm
Bảng chiều
thời gian#
chi nhánh#
hàng#
địa điểm#
tiền
số l-ợng
Bán hàng
Bảng sự kiện
nhà cung cấp#
cung cấp
tỉnh#
huyện

Nhà cung cấp
Bảng chiều
Tỉnh
Bảng chiều

Hỡnh 1.2.3 S tuyt ri

Theo dng s ny, mi bng chiu c chun hoỏ hn.

liệu trong kho thường xuyên được cập nhật so với dữ liệu nguồn. Ở đây cần phải
chú trọng vấn đề kết nối để đảm bảo các bảng dữ liệu trong kho luôn được làm
mới và duy trì các bản sao của các bảng dữ liệu không đồng bộ trong hệ quản trị
cơ sở dữ liệu phân tán. Duy trì các bản sao của các quan hệ nguồn là một phần
quan trọng trong kho dữ liệu và phạm vi ứng dụng là nhân tố quan trọng trong
tính phổ biến bản sao không đồng bộ mặc dù trong thực tế bản sao không đồng
bộ trái với nguyên tắc của dữ liệu phân tán độc lập.
- 4: Một việc quan trọng nữa trong quá trình duy trì kho dữ liệu là theo
dõi dữ liệu đang được lưu giữ trong kho dữ liệu. Vấn đề này được giải quyết
bằng cách lưu trữ thông tin dữ liệu trong kho thông qua các danh mục hệ thống.
Các danh mục hệ thống nếu lưu trữ cùng với kho dữ liệu thì rất lớn, do đó nó
được lưu trữ trong một cơ sở dữ liệu riêng gọi là metadata repository. Kích
thước và độ phức tạp của các danh mục chủ yếu phụ thuộc vào kích thước và độ
phức tạp của kho dữ liệu.
1.3. Xử lý dữ liệu trực tuyến (OLAP)
1.3.1. Lý do sử dụng OLAP
- Các ứng dụng OLAP chủ yếu tập trung vào các truy vấn phức tạp, đặc
biệt. Trong SQL đó là những truy vấn liên quan tới các toán tử nhóm (group-by)
và kết hợp. OLAP giải quyết các vấn đề trên mô hình dữ liệu đa chiều.
- OLAP có chức năng tạo báo cáo và phân tích dữ liệu. Kiến trúc chức
năng của OLAP bao gồm 3 phần: dịch vụ lưu trữ dữ liệu, các dịch vụ truy vấn
OLAP và các dịch vụ hiển thị đối với người dùng.

Trích đoạn Phõn tớch chức năng Nội dung thụng tin cần khai thỏc Xõy dựng tiến trỡnh trợ giỳp cho bài toỏn Phõn tớch và hiển thị dữ liệu
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status