Bài giảng
NGUYÊN LÝ MÁY HỌC
Phạm Nguyên Khang
01/2014
2
Giới thiệu
Mục tiêu
ν Cung cấp kiến thức cơ bản về quá trình học tự động/dạy cho máy học
ν Học có giám sát (supervised learning), học không giám sát (unsupervised learning)
ν Bài toán: Phân lớp (classification), Hồi quy (regression), Gom cụm (clustering)
ν Ứng dụng: nhận dạng chữ viết tay, phân loại văn bản
3
Giới thiệu
Chương 0
ν Tại sao phải học Nguyên lý máy học ?
ν Như thế nào là một định nghĩa đúng về máy học ?
ν Ví dụ: học chơi cờ
ν Các vấn đề có liên quan
Chương 1
ν Học giám sát
ν Mạng nơ-ron (chương 2, giáo trình NLMH)
ν Perceptron
ν Mạng nơ-ron đa tầng
ν Bài tập
4
Giới thiệu
Chương 2
ν Máy học véc-tơ hỗ trợ - SVM (chương 3 giáo trình NLMH)
ν Mô hình hoá bài toán SVM
ν Lý thuyết: 20 tiết
ν Thực hành/bài tập lớn: 20 tiết
Đánh giá
ν Thi giữa kỳ: 20%
ν Thực hành/bài tập lớn: 30%
ν Thi kết thúc học phần: 50%
Nguyên lý máy học
Chương 0
Phạm Nguyên Khang
Tại sao phải học NLMH
• Tiến bộ gần đây trong giải thuật và tin học lý thuyết
• Dữ liệu ngày càng nhiều hơn, nhất là dữ liệu trực tuyến
• Năng lực tính toán của máy tính ngày càng phát triển (phần
cứng)
• Đất dụng võ dành cho dân máy học
– Khai khoáng dữ liệu (data mining): sử dụng dữ liệu quá khứ để
dự đoán tương lai ! cải thiện quá trình quyết định.
• Thông tin y khoa ! kiến thức y khoa
– Ứng dụng phần mềm mà ta không thể lập trình thủ công
• Xe tự hành
• Nhận dạng tiếng nói
– Chương trình tự tuỳ biến
• Chương trình đọc tin tức có thể học để biết được sự quan tâm của
người dùng.
Nhiệm vụ tiêu biểu của DM
• Cho dữ liệu:
– 9714 hồ sơ bệnh nhân, mỗi hồ sơ dành cho một phụ nữ
mang thay và sinh con
– Mỗi hồ sơ có 215 đặc điểm liên quan đến bệnh nhân: độ
• Tâm lý học và thần kinh học (neurobiology)
• Thống kê
• …
Học là gì ?
• Học (Mitchel)= Cải thiện tác vụ (task) nào đó
bằng kinh nghiệm
– Cải thiện tác vụ T,
– Với độ đo hiệu quả P
– Dựa trên kinh nghiệm E
• Ví dụ: học chơi cờ
– T: chơi cờ
– P: % ván thắng
– E: cơ hội để tự đánh với chính mình
Học chơi cờ
• T: chơi cờ
• P: % ván thắng
• Kinh nghiệm gì ?
• Nên học gì ?
• Biểu diễn nó như thế nào ?
• Giải thuật nào để học ?
Kiểu dạy/huấn luyện
• Trực tiếp hay gián tiếp ?
• Có thầy hay không có thầy ?
• Vấn đề: việc huấn luyện có phải là kinh nghiệm
có thể biểu diễn được của mục tiêu hiệu quả ?
Chọn hàm mục tiêu
• Lựa chọn nước đi: Bàn cờ " Nước đi ??
• V: Bàn cờ " R ?? Lượng giá bàn cờ
• …
Dự báo giá đất dựa trên diện tích