Giới thiệu máy học
ThS. Dương Thị Thùy Vân
Khoa CNTT-TƯD
Trang 2
Học là gì?
•
ghi nh i u gì óớ đ ề đ
•
h c các s ki n qua quan sát và th m dòọ ự ệ ă
•
c i thi n các k n ng v n ng và/hay nh n th c ả ệ ỹ ă ậ độ ậ ứ
qua vi c luy n t pệ ệ ậ
•
t ch c tri th c m i thành các bi u di n t ng quát, ổ ứ ứ ớ ể ễ ổ
hi u quệ ả
Thế nào là máy học (Machine Learning)
•
Máy h c có ngh a là vi c mô hình hóa môi tr ng xung ọ ĩ ệ ườ
quanh hay kh n ng m t ch ng trình máy tính sinh ra ả ă ộ ươ
m t c u trúc d li u m i khác v i c u trúc hi n có. Ch ng ộ ấ ữ ệ ớ ớ ấ ệ ẳ
h n vi c tìm ra nh ng lu t ạ ệ ữ ậ If…then… t t p d li u u ừ ậ ữ ệ đầ
vào.
(Krzysztof J. Cios, Witold Pedrycz, Roman W. Swiniarski. Data Mining
Methods for Knowledge Discovery. Kluwer Academic Publishers, 1998)
Thế nào là khám phá tri thức
(knowledge discovery) ?
•
Khám phá tri th c là tìm ra nh ng tri th c ti m n, ứ ữ ứ ề ẩ
nh ng tri th c m i (không ph i là nh ng tri th c ữ ứ ớ ả ữ ứ
kinh i n, kinh nghi m, …)đ ể ệ
Dữ liệu
Tiếp cận toán tử logic
–
Tiếp cận hình học
(phân hoạch không gian, xây dựng cây định danh, …)
–
Tiếp cận mạng Neural
–
Tiếp cận khai mỏ dữ liệu
–
…
Ví dụ 1
Ch ng trình oán ý ngh con ng i. Máy s oán ng i ch i ươ đ ĩ ườ ẽ đ ườ ơ
ngh s 0 hay 1 trong u, ng i ch i s ph i tr l i cho ĩ ố đầ ườ ơ ẽ ả ả ờ
máy bi t là máy ã oán úng hay sai. t ó máy tính s h c ế đ đ đ Để ừ đ ẽ ọ
qui lu t suy ngh a c a ng i ch i.ậ ĩ ủ ườ ơ
Học dựa trên cây định danh
•
Ví d : ụ Xây d ng các quy lu t k t lu n m t ng i nh ự ậ để ế ậ ộ ườ ư
th nào khi i t m bi n thì b cháy n ng. ế đ ắ ể ị ắ
•
Ta g i tính ch t cháy n ng hay không cháy n ng là thu c ọ ấ ắ ắ ộ
tính quan tâm (thu c tính m c tiêu).ộ ụ
R = {“cháy n ng”, “bình th ng”}ắ ườ
Học dựa trên cây định danh
•
P = t p h p 8 ng i quan sát c v i ậ ợ ườ đượ ớ 4 thu c tính ộ
:
–
ề ấ
–
-.
/.
0
.
1
2.
–
.
/ 3ổ ố ầ ử ạ ị ộ
4 -ẫ ấ . 3 5ị ộ ụ
ổ ố ầ
3 4 -ử ạ ị ộ ẫ ấ .
–
đ
0
1
2
3 5ị ủ ộ ụ
–
$ 6 3- 7 ư ậ ế ộ ộ ể ậ ộ ị
7 #ẽ đặ ư
Thuật toán Quinlan
•
M t vector V(Aj ) c g i là vector n v n u nó ch có ộ đượ ọ đơ ị ế ỉ
–
,
!
=+/0>0?>0/0?=A
–
C=A+D3!'1
Thuật tốn Quinlan
•
Các thuộc tính khác được tính tương tự
–
,
"#"
"/?>11>1/?0
–
,
"#"
# /1>@0>@
–
,
"#"
/0>@1>@
–
,
"#$%
$E/0>10>1
–
,
"#$%
# /0>@1>@
–
$%
&'
(
)*+
Sarah T.Bình Nhẹ Không Cháy
Dana Cao
T.Bình
Có Không
Annie Thấp
T.Bình
Không Cháy
Kartie Thấp
Nhẹ
Có Không
Thuật tốn Quinlan
•
V
C.Cao
(Cao) = (0/1,1/1) = (0,1)
•
V
C.Cao
(T.B) = (1/1,0/1) = (1,0)
•
V
C.Cao
(Thấp) = (1/2,1/2)
•
V
C.Nặng
F'!
Alex
Peter
John
Sarah
Dana
Annie
Kartie
Emmile