ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
BÁO CÁO MÔN
CƠ SỞ DỮ LIỆU NÂNG CAO
ĐỀ TÀI:
PHƯƠNG PHÁP PHÂN TÍCH CỤM
TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN
GVHD : PGS.TS Nguyễn Hà Nam
HVTH : Khúc Ngọc Hiệp
Nguyễn Quang Minh
∗
Cơ sở dữ liệu không gian
∗
Khai phá dữ liệu không gian
∗
Phân tích cụm
NỘI DUNG TRÌNH BÀY
Guting (1994) định nghĩa :
- Là một cơ sở dữ liệu
- Có các kiểu dữ liệu không gian trong mô hình dữ
liệu và ngôn ngữ truy vấn của nó
- Hỗ trợ các kiểu dữ liệu không gian và cung cấp ít
nhất là chỉ số không và một thuật toán hiệu quả
cho phép kết không gian
CƠ SỞ DỮ LIỆU KHÔNG GIAN
CƠ SỞ DỮ LIỆU KHÔNG GIAN
Các đặc điểm của cơ sở dữ liệu không gian:
Các kiểu dữ liệu không gian
Đánh chỉ số dữ liệu không gian
* Phép kết không gian (spatial joins)
KHAI PHÁ DỮ LIỆU KHÔNG GIAN
∗
Phân cụm là một trong những nhiệm vụ chính của
khai phá dữ liệu, là một kỹ thuật chung cho phân tích
dữ liệu thống kê
∗
Phân tích cụm bản thân nó không phải là một thuật
toán riêng, mà là một nhiệm vụ chung cần được giải
quyết
PHÂN TÍCH CỤM
PHÂN TÍCH CỤM
∗
Các thuật toán phân cụm:
1. Phân cụm thứ bậc 3. Phân cụm dựa vào tâm
2. Phân cụm theo phân bố 4. Phân cụm theo mật độ
∗
các yêu cầu riêng cho các thuật toán phân cụm:
∗
Cần các thuật toán hiệu quả và mở rộng được
∗
Các thuật toán có thể xác định được các hình không theo quy luật
∗
Các phương pháp phân cụm không nhạy cảm với lượng lớn nhiễu.
∗
Các thuật toán không nhạy cảm với thứ tự của dữ liệu vào
∗
Không yêu cầu có kiến thức trước về dữ liệu
PHÂN TÍCH CỤM
∗
Phân cụm theo phân bố:
∗