Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục vụ công tác quản lý - Pdf 10



1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
TRẦN NAM QUỲNH XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ
VIỄN THÔNG PHỤC VỤ CÔNG TÁC QUẢN LÝ CHUYÊN NGÀNH: TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH
MÃ SỐ: 60.48.15

Ngư
ời h
ư
ớng dẫn khoa học:

PGS.TS. LÊ HỮU LẬP TÓM TẮT LUẬN VĂN THẠC SĨ


được xây dựng. Nhiều khách hàng không thoả mãn với những hệ thống thông tin
hiện thời.
Một cách tiếp cận được đề xướng bởi B.Inmon là sự kết hợp của một số giải
pháp kỹ thuật và được đặt tên là Data Warehoushing - kỹ thuật xây dựng các
kho dữ liệu. Data Warehouse được định nghĩa như một tập hợp các phương tiện
cho phép hình dung dữ liệu một cách tổng thể, hướng đối tượng để giúp cho việc
phân tích và ra quyết định.
2. Mục đích của đề tài: Tiếp cận các phương pháp khai phá dữ liệu để tích hợp
dữ liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy
nhất nhằm cung cấp thông tin trợ giúp cho việc phân tích và ra quyết định.
3. Đối tượng và phạm vi nghiên cứu: Việc nghiên cứu sẽ tập trung xây dựng
các báo cáo dựa trên kho dữ liệu tích hợp từ các nguồn dữ liệu hiện có với các
ứng dụng quản lý điều hành sản xuất kinh doanh của VNPT Quảng Ninh.
4. Phương pháp nghiên cứu: Tìm hiểu các tài liệu liên quan đến Data
Warehouse các kỹ thuật truy cập, phân tích và khai phá dữ liệu.
3

5. Kết cấu của luận văn
Luận văn bao gồm 3 chương:
Chương 1: Tổng quan về Kho dữ liệu và Khai phá dữ liệu
Tìm hiểu về kho dữ liệu, đặc điểm, phân loại, sử dụng đồng thời nghiên
cứu và trình bày về Khai phá dữ liệu.
Chương 2: Xây dựng kho dữ liệu.
Chương này phân tích các yêu cầu xây dựng kho dữ liệu; Các mô hình dữ
liệu; Cấu trúc, kiến trúc trong việc xây dựng kho dữ liệu.
Chương 3: Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn thông phục
vụ công tác quản lý.

Tùy thuộc vào quy mô tổ chức, cách tổ chức và vị trí của Data Warehouse mà
người ta chia Data Warehouse nói chung ra thành hai loại là: Data Mart và
Enterprise Data Warehouse. 1.1.3.1. Khái niệm Enterprise Data Warehouse
Nếu như một Enterprise Data Warehouse là một cơ sở dữ liệu bao gồm dữ
liệu về nhiều đối tượng khác nhau, trên toàn bộ cơ quan và thường được xây
dựng tập trung.
1.1.3.2. Khái niệm Data Mart
Data Mart cũng là một cơ sở dữ liệu có những đặc điểm giống với kho dữ
liệu nhưng quy mô của nó nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực, một
chuyên ngành cụ thể.
1.1.3.3. Phân loại Data Mart
- DM phụ thuộc.
- DM độc lập.
1.1.3.4. Siêu dữ liệu (Metadata)
Metadata là một loại “dữ liệu về dữ liệu”, nó được xây dựng nhằm mục
đích mô tả cấu trúc nội dung về dữ liệu bên trong cơ sở dữ liệu. Metadata có ý
nghĩa đặc biệt quan trọng trong việc xây dựng và tổ chức lưu trữ dữ liệu của
Data Warehouse. 5

1.1.4. Các phương pháp sử dụng kho dữ liệu
1.1.4.1. Cách sử dụng truyền thống
Trong cách sử dụng này việc khai thác thông tin dựa trên các công cụ truy
vấn và báo cáo. Nhờ có việc trích lọc, tích hợp và chuyển đổi các dữ liệu thô
sang dạng dữ liệu có chất lượng cao và có tính ổn định.

1.2.2.2. Hệ ra quyết định
Khai phá dữ liệu chiếm một vị trí quan trọng và nằm ở trung tâm của quá trình
Khám phá tri thức từ cơ sở dữ liệu. Nó có mối liên hệ chặt chẽ với hệ ra quyết
định như trong sơ đồ sau:

Hình 1.3: Khai phá dữ liệu với Hệ ra quyết định
Nhưng trên thực tế, thuật ngữ khai phá dữ liệu thông dụng và được sử
dụng rộng rãi hơn nhiều so với thuật ngữ khám phá tri thức trong CSDL (KDD).
Kho ch
ứa
dữ liệu
Khai phá
dữ liệu
Tri thức
Ngư
ời
dùng
Làm s
ạch
và tích hợp
L
ựa chọn
và chuyển
đổi dữ liệu
Ư
ớc l
ư
ợng
và biểu diễn
Cơ sở

CSDL Kho dữ
liệu
Cơ sở tri
thức
Làm sạch dữ liệu
Tích hợp dữ liệu
Lọc 8

liệu và các siêu dữ liệu từ nhiều nguồn thành một nguồn mang tính lôgic duy
nhất nhằm cung cấp thông tin mềm dẻo từ các nguồn khác nhau và thỏa mãn
nhiều loại người dùng khác nhau. Nâng cao chất lượng dữ liệu bằng các phương
pháp làm sạch dữ liệu và tinh lọc dữ liệu theo những hướng chủ đề nhất định
nên dữ liệu sẽ rõ ràng, thống nhất hơn.
Sử dụng các phương pháp, kỹ thuật Khai phá dữ liệu nêu trên một cách
hợp lý sẽ giúp chúng ta có được những thông tin quan trọng, cần thiết và có giá
trị cao trong hoạt động quản lý điều hành, sản xuất kinh doanh cũng như trong
các lĩnh vực khác của đời sống xã hội. 9

CHƯƠNG II
XÂY DỰNG KHO DỮ LIỆU


SmartClient

/OneClick
Deployment
Solution
Công ngh
ệ phân tán ứng dụng dạng WinForm, một giải
pháp xây dựng ứng dụng mới bên cạnh các dạng công
nghệ có quá nhiều nhược điểm như thin-client (WEB: dễ
triển khai, khó phát triển), thick-client (desktop-client:
phát triển nhanh, khó triển khai, khó bảo trì).
4.

Internet
Explorer
Trình duyệt (Web browser) chuẩn, miễn phí của
Microsoft
5.

ASP.NET Công nghệ xây dựng ứng dụng WEB trên nền .NET 10

6.

Remoting/SOAP

Một trong hai công nghệ xây dựng ứng dụng phân tán
cấp doanh nghiệp chuẩn của Microsoft (công nghệ còn

ày, các báo bi
ểu đ
ư
ợc hosting l
ên máy
chủ RAS, các client (Application hoặc WEB) truy xuất
báo biểu theo cùng một công nghệ, một cách thức
Giải pháp Oracle DBMS
9.

Oracle CSDL quan hệ mạnh & phổ biến nhất hiện nay 11
2.2.2. Cấu trúc chung thành phần truy cập dữ liệu
• Các công cụ truy cập
Cấu trúc chung của thành phần truy cập dữ liệu được mô tả tại hình 2.1:


to SQL

Split
query

Translate
to DB API

Control and administration

Translate
to API

Combine
results

Translate to
relational

Data source 1
Data source 2

Enquiry
Response 122.3.3. Kiến trúc hướng dịch vụ


Hình 2.6: Lược đồ hình sao

b. Lược đồ bông tuyết rơi

Hình 2.7: Lược đồ bông tuyết rơi
c. Lược đồ kết hợp
Là kết hợp giữa sơ đồ hình sao và sơ đồ hình tuyết rơi.
2.5.2. Mô hình dữ liệu đa chiều
Hình 2.8 thể hiện câu truy vấn theo bốn chiều: khách hàng, dịch vụ, thời gian. 14Hình 2.8: Mô hình dữ liệu đa chiều
2.5.3. Bảng sự kiện
Bảng sự kiện điển hình có hai kiểu cột, chúng chứa đựng những sự kiện
số (thường gọi là thước đo), và chứa khóa của các bảng dimension.
2.5.4. Bảng chiều
Các chiều là cách mô tả chủng loại mà theo đó các dữ liệu số trong khối
được phân chia để phân tích. Khi xác định một chiều, chọn một hoặc nhiều cột
của một trong các bảng liên kết (bảng chiều).
2.5.5. Bảng sự kiện tổng hợp
Bảng tổng hợp
– Bảng tổng hợp nhằm mục đích trả lời nhanh các câu hỏi thường gặp.
Bảng sự kiện tổng hợp
– Nhận diện các bảng dữ kiện yêu cầu
– Các tổng hợp ở thứ tự cao có thể được tính toán từ các tổng hợp thứ tự
thấp,

CHƯƠNG III
XÂY DỰNG KHO DỮ LIỆU KHÁCH HÀNG SỬ DỤNG DỊCH VỤ VIỄN
THÔNG
3. 1. Nghiên cứu hệ thống nguồn ccbs
Hệ thống CCBS gồm 4 khối chức năng chính:
o Tính cước, chăm sóc và hỗ trợ khách hàng BCSS.
o Cắt mở thuê bao, dịch vụ tự động
o Quản lý điều hành sửa chữa báo hỏng.
o Quản lý mạng ngoại vi
Khách hàngKhách hàngKhách hàngKhách hàng Khách hàngKhách hàngKhách hàng
Call CenterCall Center
Điểm giao dịchĐiểm giao dịch WebWeb EmailEmail
Hệ thống tính
cước & hỗ trợ
khách hàng
Hệ thống Quản lý
mạng ngoại vi
Hệ thống Cắt mở
thuê bao dịch vụ tự
động
Hệ thống Điều
hành sửa chữa
báo hỏng
Hệ thống CCBS tổng thể

Hình 3. 1: Hệ thống CCBS tổng thể
3.2. Thiết kế kho dữ liệu
3.2.1. Kiến trúc kho dữ liệu viễn thông
Kiến trúc hệ thống kho dữ liệu viễn thông bao gồm máy chủ chuyển đổi
dữ liệu, máy chủ cở sở dữ liệu để lưu kho dữ liệu, máy chủ báo cáo + web

18

3.2.5. Trích xuất, chuyển đổi nạp dữ liệu
3.2.5.1. Mô tả chung
3.2.5.2. Ánh xạ cho các chiều
3.2.5.3. Ánh xạ cho các bảng sự kiện
3.2.6. Thiết kế công cụ báo cáo
Báo cáo là phần không thể thiếu trong các hệ thống kho dữ liệu. Việc
xây dựng công cụ tạo báo cáo động và hệ thống báo cáo từ xa được xem xét để
phát triển hệ thống báo cáo. Công cụ cho phép quản lý báo cáo đầu ra và cho
phép người dùng bổ xung báo cáo vào hệ thống, mở rộng khả năng khai thác
của người dùng và đáp ứng nhu cầu sử dụng lâu dài.
 Mô hình báo cáo từ xa sử dụng Webservice

Hình 3.19: Mô hình báo cáo từ xa sử dụng Webservice
3.2.6.1. Kiến trúc và công nghệ
3.2.6.2 Các chức năng cho hệ thống báo cáo
3.2.7. Thiết kế công cụ tra cứu động
Tương tự như phần báo cáo, tra cứu động là phần không thể thiếu trong
các hệ thống kho dữ liệu. Chức năng tra cứu động tương tự như phần báo cáo,
chỉ có cách hiển thị kết quả khác nhau.
3.2.8. Thiết kế công cụ quản trị hệ thống
Chức năng quản trị hệ thống cho phép người quản trị hệ thống định
nghĩa các quyền và phân quyền cho người dùng. Giúp cho hệ thống kiểm soát
được các phiên truy cập và đảm bảo tính toàn vẹn của dữ liệu.
H
ệ thống

khác
Máy chủ báo cáo

 Giao diện phân quyền sử dụng báo cáo
 Giao diện thiết lập xử lý số liệu
 Giao diện tạo danh mục báo cáo
 Giao diện báo cáo thông kê
 Giao diện biểu đồ thống kê
3.3. Kết luận chương
Với việc phân tích hệ thống nguồn CCBS hiện có của VNPT QUANG
NINH cũng như các nhu cầu thực tế nhằm nâng cao hiệu quả điều hành sản xuất
kinh doanh, để thấy được tầm quan trọng của việc phải xây dựng một hệ thống
kho dữ liệu. Thiết kế kho dữ liệu DWH tập trung dựa trên các hệ thống dữ liệu
rời rạc (từ nhiều nguồn dữ liệu khác nhau), nhằm mục đích khai thác tốt hơn,
hiệu quả hơn dữ liệu hỗ trợ việc ra quyết định. Từ các nguồn dữ liệu rời rạc khác
nhau không thể đưa ra cái nhìn tổng thể, hoặc hiệu quả của một vấn đế, nên các
quyết định sẽ không đạt độ chính xác cao. Sau khi nghiên cứu, ứng dụng với
công cụ warehouser builder của oracle… áp dụng thử nghiệm cho kho dữ liệu.
Dữ liệu đã được tích hợp, nhất là với dữ liệu báo cáo đã đạt đến độ chính xác
cao. Nhìn vào kết các báo cáo phân tích đã đưa ra được nhiều chiều của dữ liệu.
Nhất là biểu đồ thống kê của báo cáo đã đánh giá được sự hiệu quả của kho dữ
liệu. 20

KẾT LUẬN
Luận văn nghiên cứu “Xây dựng kho dữ liệu khách hàng sử dụng dịch vụ viễn
thông phục vụ công tác quản lý” đã được hoàn thành.
 Phân tích công nghệ, cấu trúc, kiến trúc dịch vụ, lược đồ, mô hình dữ liệu
và công cụ để xây dựng một kho dữ liệu. Tìm hiểu các phương pháp, kỹ
thuật Khai phá dữ liệu và cách sử dụng các phương pháp, kỹ thuật này với
từng loại dữ liệu để mang lại hiệu quả cao nhất cho kho dữ liệu.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status