Chương 2. Cơ sở dữ liệu web
2 - 1/43
CHƯƠNG 2
CƠ SỞ DỮ LIỆU WEB
CƠ SỞ DỮ LIỆU WEB & XML
Chương 2. Cơ sở dữ liệu web
2 - 2/43
2.1 Cở sở dữ liệu Web
2.2 Khai phá dữ liệu và Web
2.3 Kiến trúc cơ sở dữ liệu web
2.4 Mối quan hệ với XML
Chương 2: Cơ sở dữ liệu web
Chương 2. Cơ sở dữ liệu web
2 - 3/43
MỤC TIÊU
- Trình bày được:
+ Các khái niệm về web, csdl web
+ Thu thập và khai phá các loại dữ liệu
+ Các kiến trúc csdl trên web
+ Quan hệ giữa csdl web và xml
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
2 - 4/43
2.1 Cở sở dữ liệu Web
2.1.1 Trình bày d
ữ
li
ệ
u và mô hình d
ữ
Specifications by
W3C
Models for web
and other
Extensions
Chương 2. Cơ sở dữ liệu web
2 - 6/43
2.1 Cở sở dữ liệu Web
2.1.2 Ch
ứ
c năng qu
ả
n lý cơ s
ở
d
ữ
li
ệ
u
Cơ sở dữ liệu web là csdl cho các website trên internet.
- quản lý cơ sở dữ liệu web bao gồm:
xử lý vấn tin
cập nhật dữ liệu
quản lý siêu dữ liệu
bảo mật và toàn vẹn dữ liệu
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
ở
d
ữ
li
ệ
u
- Quản lý siêu dữ liệu
mô tả các thông tin liên quan đến cơ sở dữ liệu (người
dùng, điều khiển truy cập và các chính sách )
môi trường động
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
2 - 9/43
2.1 Cở sở dữ liệu Web
2.1.2 Ch
ứ
c năng qu
ả
n lý cơ s
ở
d
ữ
li
ệ
u
- Quản lý lưu trữ
chỉ mục thích hợp
2 - 11/43
2.1 Cở sở dữ liệu Web
2.1.3 Cơ s
ở
d
ữ
li
ệ
u bán c
ấ
u trúc
- Dữ liệu có cấu trúc là dữ liệu có một cấu trúc hoàn toàn xác
định, mỗi phần tử có kiểu cụ thể như interger, string, real,
- Dữ liệu không có cấu trúc là dữ liệu không có một cấu trúc
nhất định (dữ liệu đa phương tiện, văn bản, hình ảnh,…)
-
Dữ liệu bán cấu trúc là dữ liệu có cấu trúc không đầy đủ nhưng
có cấu trúc từng phần (phân đoạn tiêu đề, tác giả)
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
2 - 12/43
2.1 Cở sở dữ liệu Web
2.1.3 Cơ s
ở
d
ữ
li
ệ
u bán c
ấ
2.2 Khai phá dữ liệu và Web
CƠ SỞ DỮ LIỆU WEB
Web mining
Mining Data Source on
the web
Mining Usage Patterns
on the web
Extract Patterns from
Data Source
Give advice to Users
while browsing
Khai phá dữ liệu web
Chương 2. Cơ sở dữ liệu web
2 - 15/43
2.2 Khai phá dữ liệu và Web
CƠ SỞ DỮ LIỆU WEB
Giao diện đồ hoạ cho người dùng
Đánh giá mẫu
Máy khai mỏ dữ liệu
Máy chủ cơ sở dữ liệu hay
kho dữ liệu
Cơ sở dữ liệu
Làm sạch và tích hợp
Lọc
Cơ sở tri thức
Kiến trúc hệ thống khai mỏ dữ liệu
Kho dữ liệu
Chương 2. Cơ sở dữ liệu web
2 - 16/43
2.2 Khai phá dữ liệu và Web
người dùng giao tiếp với hệ thống
đặc tả yêu cầu khai phá, cung cấp thông tin trợ giúp cho
việc tìm kiếm và thực hiện khai phá
xem các lược đồ cơ sở dữ liệu, kho dữ liệu, đánh giá mẫu
và hiển thị các mẫu trong các khuôn dạng khác nhau.
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
2 - 19/43
2.2 Khai phá dữ liệu và Web
- Quá trình khai phá tri thức gồm các bước sau:
Làm sạch dữ liệu
Tích hợp dữ liệu
Lựa chọn dữ liệu
Chuyển đổi dữ liệu
Khai phá dữ liệu
Đánh giá mẫu
Biểu diễn tri thức
CƠ SỞ DỮ LIỆU WEB
Chương 2. Cơ sở dữ liệu web
2 - 20/43
2.2 Khai phá dữ liệu và Web
2.2.1 Khai phá d
Chương 2. Cơ sở dữ liệu web
2 - 22/43
2.2 Khai phá dữ liệu và Web
2.2.1 Khai phá d
ữ
li
ệ
u trên web
CƠ SỞ DỮ LIỆU WEB
Khai mỏ dữ liệu đa phương tiện
Web Miner
Intergration through the web
with tools like XML
Video Data Text DataMultimedia Data
Chương 2. Cơ sở dữ liệu web
2 - 23/43
2.2 Khai phá dữ liệu và Web
2.2.1 Khai phá d
ữ
li
ệ
u trên web
Nhiều chuẩn truy cập và quản lý dữ liệu web được phát triển bao
gồm nhiều mô hình, ngôn ngữ đặc tả và kiến trúc:
International Standards Organization - ISO
W3C (XML – DTD)
Object Management Group - OMG
ữ
li
ệ
u s
ử
d
ụ
ng m
ẫ
u
CƠ SỞ DỮ LIỆU WEB
Phân tích mẫu và dự đoán
Web information
Management
Analyze
Usage Pattern
Guidance
to User