Khai thác các dữ liệu phức tạp - Pdf 10

1
1
KHAI THÁC
DỮ LIỆU &
ỨNG DỤNG
(DATA MINING)
GV : NGUYỄN HOÀNG TÚ ANH
2
B
BB

ÀÀ
ÀI
I I
I 6
66
6
KHAI THÁC DỮ
LIỆU PHỨC TẠP
2
3
NỘI DUNG
1.Text mining
2.Web mining
4
TEXT MINING
Text mining :
 Một nhánh của khai thác dữ liệu
 Mục đích : tìm kiếm và rút trích tri thức từ tài
liệu văn bản
Ví dụ :

4
7
TEXT MINING
Xử lý ngôn ngữ tự nhiên (NLP) :
 Mục đích : hiểu ngôn ngữ tự động
 Không khả thi
 Phân tích văn bản :
 Sự đồng nghĩa
 Nhận dạng cụm từ.
 Mối liên kết ngữ nghĩa
Truy vấn thông tin (IR):
 Thông tin tổ chức thành các tư liệu
 Vấn đề của truy vấn thông tin : xác định các
tài liu liên quan dựa trên yêu cầu người
dùng như từ khóa hoặc tài liệu mẫu.
8
TRUY VẤN THÔNG TIN
Hệ thống IR thông thường
 Danh mục trực truyến của thư viện
 Hệ thống quản lý tài liệu trực tuyến
Truy vn thông tin <> H thng CSDL
 Một số vấn đề của CSDL không tồn tại trong lĩnh vực IR
như cập nhật, quản lý giao dịch, đối tượng phức tạp.
 Một số vấn đề của IR không được quan tâm trong hệ quản
trị CSDL như tài liệu không cấu trúc, tìm kiếm tương đối
dựa trên từ khoá liên quan
Các phương pháp truy vấn thông tin :
 Truy vấn dựa trên từ khóa
 Truy vấn dựa trên sự giống nhau
 Latent Semantic Indexing


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status