ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết - Pdf 24

TRƢỜNG ĐẠI HỌC LẠC HỒNG

DỰ ĐOÁN KẾT QUẢ HỌC TẬP
CỦA SINH VIÊN TRƢỜNG NGHỀ
SỬ DỤNG PHƢƠNG PHÁP HỒI QUY BAYES
GIÁO VIÊN HƢỚNG DẪN:
TS. HOÀNG THỊ LAN GIAO
HỌC VIÊN THỰC HIỆN:
VÕ THỊ NGỌC LIÊN
Đồng Nai, tháng 09/2013
1
NỘI DUNG TRÌNH BÀY
I. Tổng quan khai phá dữ liệu và phát hiện tri thức
II. Hệ hỗ trợ ra quyết định và mô hình hỗ trợ quyết định
III. Phân tích hồi quy
IV. Dự đoán kết quả học tập dựa vào lý thuyết phân lớp
Naive Bayes
2
3
TỔNG QUAN KHAI PHÁ DỮ LIỆU VÀ
PHÁT HIỆN TRI THỨC
Giới thiệu về khai phá dữ liệu (KPDL)
 Khai phá tri thức từ một lượng lớn dữ liệu
 Sử dụng dữ liệu lịch sử để khám phá những qui tắc và cải
thiện những quyết định trong tương lai
4
Quy trình phát hiện tri thức
Hình 1: Quy trình phát hiện tri thức
Bước 1: Hình thành, xác định,
định nghĩa bài toán
Bước 2: Thu thập, tiền xử lý

 Các bƣớc chính để giải quyết bài toán phân lớp
Bước 1: Học (Training): xây dựng mô hình phân lớp
Bước 2: Phân lớp (classification): Bước này sử dụng mô hình
phân lớp đã được xây dựng ở bước 1 để kiểm tra,
đánh giá và thực hiện phân lớp.
9
 Các kỹ thuật phân lớp
– Phương pháp dựa cây quyết định
– Phương pháp dựa trên luật
– Phương pháp Naive Bayes
– Mạng Neuron
– …
 Phƣơng pháp phân lớp Naive Bayes
 Định lý Bayes
Tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự
kiện liên quan B đã xảy ra.
– Xác suất này được ký hiệu là P(A|B)
– Đọc là "xác suất của A nếu có B".
10
Theo định lí Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc
vào 3 yếu tố:
 P(A): Xác suất xảy ra A của riêng nó
 P(B): Xác suất xảy ra B của riêng nó.
 P(B|A): Xác suất xảy ra B khi biết A xảy ra
Khi biết ba đại lƣợng trên, xác suất của A khi biết B cho bởi
công thức:
   
   









Theo tính chất độc lập điều kiện:
  



 






Trong đó:
- 



 xác suất thuộc tính thứ k mang giá trị x
k
khi đã biết X
thuộc phân lớp i.
13
Các bƣớc thực hiện thuật toán phân lớp Naive Bayes
 Bước 1: Huấn luyện Naive Bayes (dựa vào tập dữ liệu), tính






Ví dụ: Tập dữ liệu mẫu về kết quả học tập của sinh viên
TT
Nơi ở
Điểm vào

Kinh tế

Gtinh

Kết quả
1 Nông thôn
Trung bình
Thấp

Nữ

Rớt

2 Thành thị
Cao

Trung bình

Nam



Nam

Đậu

7 Nông thôn
Trungbình

Cao

Nữ

Đậu

8 Thành thị
Thấp

Thấp

Nam

Rớt

Yêu cầu: Phân lớp cho một thể hiện mới sau đây
X=<Nông thôn, thấp, trung bình, nam> (kết quả là Đậu (Đ) hay
Rớt (R)).
15
Thực hiện:
Bước 1: Ta có 2 lớp Đ=“Đậu”, R= “Rớt”, tổng số mẫu =8
 Số mẫu được phân lớp Đ là 5  Xác suất Đậu: P(Đ)=5/8

P(Nông thôn| Đ
) =2/5
P(Nông thôn| R
) =2/3
Điểm vào
P(Cao| Đ)
=2/5
P(Cao| R) =0/3

P(Trung bình| Đ)=3/5

P(Trung bình| R)=1/3

P(Thấp| Đ) =0/5

P(Thấp| R) =2/3

Kinh tế
P(Cao| Đ) =3/5

P(Cao| R)
=0/3
P(Trung bình| Đ)=2/5

P(Trung bình| R)=1/3

P(Thấp| Đ) =0/5

P(Thấp| R)
=2/3

Một số ƣu điểm của phƣơng pháp Naive Bayes
– Tính xác suất rõ ràng cho các giả định.
– Kết hợp nhiều dự đoán của nhiều giả định.
– Các thuộc tính trong tập mẫu học phải độc lập với điều kiện.
– Độ chính xác thuật toán phân lớp phụ thuộc nhiều vào tập
dữ liệu học ban đầu.

19
PHÂN TÍCH HỒI QUY
20
Khái niệm phân tích hồi qui
Phân tích hồi quy là tìm mối quan hệ phụ thuộc của một biến,
được gọi là biến phụ thuộc vào một hoặc nhiều biến khác.
Ví dụ
Khi chúng ta cố gắng giải thích tiêu dùng của mọi người,
chúng ta có thể sử dụng biến giải thích là thu nhập và độ tuổi.
21
Mô hình hồi quy đơn
Phương trình hồi quy đơn biến (đường thẳng) có dạng tổng quát:
Y=a+bX
Trong đó:
Y: là biến số phụ thuộc;
X: là biến số độc lập;
a: là tung độ gốc hay nút chặn;
b: độ dốc hay hệ số góc.
22
Mô hình hồi qui tuyến tính đa biến

Mô hình hồi qui tuyến tính nhiều chiều có dạng :
Y = α + 

25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status