Ôn tập khai thác dữ liệu và ứng dụng - Pdf 10

1
1
KHAI THÁC
DỮ LIỆU &
ỨNG DỤNG
(DATA MINING)
GV : NGUYỄN HOÀNG TÚ ANH
2
ÔN TẬP
2
3
3
HÌNH THỨC KIỂM TRA VÀ
ĐÁNH GIÁ
• Hệ thống thang điểm :
– Bài thi lý thuyết : 7 điểm
– Bài tập theo nhóm : 1.5 điểm
– Bài kiểm tra giữa kỳ : 1.5 điểm
4
Cấu trúc đề thi cuối kỳ
1. Thời gian : 120’
2. Được sử dụng tài liệu, không sử dụng
Laptop.
3. Đề thi gồm 3 câu
a) Câu 1(3 điểm): nội dung thuộc chương 3
: Tập phổ biến và luật kết hợp.
b) Câu 2 (3 điểm): nội dung thuộc chương 4
và 5 : Phân lớp, gom nhóm
c) Câu 3 (1điểm): câu hỏi dạng phân tích,
tổng hợp từ kiến thức của tất cả các
chương.

 www.kdnuggets.com/solutions/index.html
4
7
ÔN TẬP
Chương 1 :
5. Khai thác dữ liệu gồm các loại nhiệm
vụ nào?
 Nhiệm vụ mô tả và dự đoán.
 Dựa trên kinh nghiệm bản thân, theo các
em loại nhiệm vụ nào của khai thác dữ
liệu được quan tâm nhiều nhất và được
ứng dụng nhiều trong :
 Lĩnh vực kinh doanh
 Lĩnh vực giáo dục
8
Chương 2 :
6. Tại sao cần chuẩn bị DL?
 Do chất lượng DL trong thực tế là xấu.
 Chất lượng DL sẽ ảnh hưởng đến quá trình
ra quyết định.
7. Các bước trong quá trình chuẩn bị DL ? Cho
ví dụ cụ thể từng bước.
 Làm sạch DL -> Chọn lọc/ Tích hợp DL ->
Biến đổi/ mã hóa DL -> Rút gọn DL
8. Phương pháp chia giỏ, phương pháp sử dụng
biểu đồ (histogram) có thể áp dụng vào
trong các bước nào của quá trình chuẩn bị
dữ liệu ?
 Làm sạch DL : khử nhiễu; Mã hóa DL : rời
rạc hóa DL; Rút gọn DL .

Tập phổ biến đóng: là tập phổ biến & không
tồn tại tập nào bao nó có cùng độ phổ biến
như nó.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status