Trí Tuệ Nhân Tạo
Nguyễn Nhật Quang
[email protected]
Trường Đại học Bách Khoa Hà Nội
Viện Công nghệ Thông tin và Truyền thông
Năm học 2012-2013
Nội dung môn học:
Giới thiệu về Trí tuệ nhân tạo
Tác tử
Định nghĩa
Môi trường công việc
Các kiểu môi trườn
g
g
Các kiểu tác tử
Giải quyết vấn đề: Tìm kiếm, Thỏa mãn ràng buộc
Logic và suy diễn
Biểu diễn tri thức
ể ễ ắ ắ
Bi
ể
u di
ễ
n tri thức không ch
ắ
c ch
ắ
n
Học máy
Trí tuệ nhân tạo
2
ệ
,)
g
ậ
(
ậ
)
môi trường xung quanh nó thông qua các bộ phậncảmbiến
(sensors) và hành động phù hợp theo môi trường đó thông
qua
các
bộ
phận
hoạt
động
(actuators)
qua
các
bộ
phận
hoạt
động
(actuators)
Tác tử con người
Các bộ phậncảmbiến: mắt, tai, và mộtsố bộ phậncơ thể khác
Các bộ phậnhoạt động: tay, chân, miệng, và mộtsố bộ phậncơ
thể khác
Tác
động
cơ
(motors)
3
Trí tuệ nhân tạo
Tác tử và Môi trườn
g
g
Hàm tác tử: là hàm ánh xạ từ lịch sử nhận thức tới các
hành động:
f: P* → A
Chương trình tác tử: hoạt động (chạy) dựa trên kiến trúc
thực tế của hàm f
ế
Tác tử = Ki
ế
n trúc + Chương trình
4
Trí tuệ nhân tạo
Ví dụ: Thế giới của máy hút bụi
Các nhậnthức
Các
nhận
thức
Ví trí và mức độ sạch sẽ
Ví dụ: [A, Bẩn], [B, Bẩn]
Các hành động
]
Di chu
y
ểnsan
g
trái
[,
ạ
]
y
g
[B, Bẩn] Hút bụi
[A, Sạch], [A, Sạch] Di chuyển sang phải
[A,
Sạch
], [A,
Bẩn
]
Hút
bụi
[A,
Sạch
],
[A,
Bẩn
]
Hút
bụi
location
=
B
then
return
Left
6
Trí tuệ nhân tạo
Tác tử h
ợp
l
ý
(
1
)
ợpý()
Tác tử cần phấn đấu để “làm đúng việc cần làm”, dựa
trên
những gì nó nhậnthức(nhậnbiết) được
và dựa
trên
những
gì
là hành đ
ộ
n
g
g
iú
p
cho tác
ộ
ộ g g( ợpý)
ộ gg p
tử đạt được thành công cao nhất đối với mục tiêu đặt ra
Đánh giá hiệu quả hoạt động: là tiêu chuẩn để đánh giá
ứ độ thà h ô t h t độ ủ ộttá tử
m
ứ
c
độ
thà
n
h
c
ô
ng
t
rong
h
oạ
Với mỗi chuỗi nhận thức có được,
Mộttáctử hợplýcầnphải
lựachọnmột hành động
Một
tác
tử
hợp
lý
cần
phải
lựa
chọn
một
hành
động
giúp cực đại hóa tiêu chí đánh giá hiệu quả hoạt động
của tác tử đó,
,
với
tri
thức
vô
hạn
Vì các nhận thức có thể không cung cấp tất cả các thông tin liên
quan
ể ổ
Các tác tử có th
ể
thực hiện các hành động nhằm thay đ
ổ
i
các nhận thức trong tương lai, với mục đích thu được
các thôn
g
tin hữu ích
(
ví d
ụ
: thu th
ập
thôn
g
tin, khám
ki
n
h
nghiệm của tác tử đó (cùng với khả năng học và thích
nghi)
9
Trí tuệ nhân tạo
Môi trường công việc – PEAS (1)
PEAS
Performance measure: Tiêu chí đánh giá hiệu quả hoạt động
Environment: Môi trường xung quanh
A
ctuators
:Cácbộ phận hành động
A
ctuators
:
Các
bộ
phận
hành
động
n c
ầ
n
phải xác định (thiết lập) các giá trị của các thành phần
của PEAS
10
Trí tuệ nhân tạo
Môi trường công việc – PEAS (2)
Ví dụ: Thiết kế một tác tử lái xe taxi tự động
Đáh iáhiệ ả h t độ (P) t à h h
Đá
n
h
g
iá
hiệ
u qu
ả
h
oạ
t
độ
ng
(P)
: an
t
Đánh
giá
hiệu
quả
hoạt
động
(P):
mức
độ
sức
khỏe
của bệnh nhân, cực tiểu hóa các chi phí, các việc kiện
cáo, …
Môi trường xung quanh (E): bệnh nhân, bệnh viện,
nhân viên y tế, …
Các bộ phận hành động (A): hiểnthị trên màn hình
Các
các
câu
hỏi
, …
12
Trí tuệ nhân tạo
Môi trường công việc – PEAS (4)
Ví dụ: Thiết kế một tác tử nhặt đồ vật
Đánh giá hiệu quả hoạt động (P): tỷ lệ (bao nhiêu
phần trăm) các đồ vật được đặt vào đúng các thùng
Môi trường xung quanh (E): dây chuyền chuyển
động trên đó có các đồ vật, các thùng đựng
Các bộ phận hành động (A): cánh tay và bàn tay
được kết nối
Các bộ phận cảm biến (S): máy quay (camera), các
bộ cảm biến các góc độ (các hướng)
13
Trí tuệ nhân tạo
Môi trường công việc – PEAS (5)
Ví dụ: Thiết kế một tác tử dạy tiếng Anh tương tác
Đánh giá hiệu quả hoạt động (P): cực đại hóa điểm
thi tiếng Anh của học viên
Môi trường xung quanh (E): một nhóm học viên
Các bộ phận hành động (A): hiểnthị màn hình các
Các
cảm
biến
(S):
bàn
phím
14
Trí tuệ nhân tạo
Môi trường công việc – PEAS (6)
Ví dụ: Thiết kế một tác tử lọc thư rác (spam emails
filt i )
filt
er
i
ng
)
Đánh giá hiệu quả hoạt động (P): khả năng lọc thư
á( tf fl iti fl ti )
r
á
c
(
amoun
t
o
f
error:
một
phần)?
Các bộ cảm biến của một tác tử cho phép nó truy cập tới trạng
thái đầy đủ của môi trường tại mỗi thời điểm
Xác định (hay ngẫu nhiên)?
Trạng thái tiếp theo của môi trường được xác định hoàn toàn dựa
tê t thái hiệ t iàhàhđộ ủ tá tử (t it thái hiệ
t
r
ê
n
t
rạng
thái
hiệ
n
t
ạ
i
v
à
hà
n
h
độ
L
ị
ch sử kinh n
g
hi
ệ
mcủatáctửđư
ợ
c chia thành các
g
iai đo
ạ
n
ị
g ệ
ợ
g
ạ
(chương/hồi)
Mỗigiaiđoạn bao gồmviệcnhậnthứccủatáctử và hành động
mà nó th
ự
chi
ệ
n
ự
ệ
Ở mỗigiaiđoạn, việclựachọn hành động để thựchiệnchỉ phụ
thuộc vào giai đoạn đó (không phụ thuộcvàocácgiaiđoạn khác)
Tĩnh (hay động)?
Tá
tử
đ
lẻ
(h
đ
tá
tử
)?
Tá
c
tử
đ
ơn
lẻ
(h
ay
đ
a
tá
c
tử
)?
Mộttáctử hoạt động độclập (không phụ thuộc / liên hệ vớicác
tác
tử
khác
)
trong
không
Phân
đoạn
?
không
không
không
Tĩnh? bán động có không
Rờirạc? có có không
Tá
tử
đ
?
khô
khô
khô
Tá
c
tử
đ
ơn
?
khô
ng
khô
ng
khô
ng
Kiểu củamôitrường có ảnh hưởng quyết định đốivới
đ
ổ
i(động), liên tục, đatáctử
19
Trí tuệ nhân tạo
Các kiểu tác tử
4 kiểu tác tử cơ bản
Tác tử phản xạ đơn giản (simple reflex agents)
Tá tử hả d tê ôhì h( d l
bdfl
Tá
c
tử
p
hả
n xạ
d
ựa
t
r
ê
n m
ô
hì
n
h
(
ột
tắ
(
l ật
)
ó
điề
kiệ
hù
h
→
Hà
n
h
độ
ng
th
eo m
ột
quy
tắ
c
(
l
u
ật
)
c
ó
điề
Sử dụng mộtmôhìnhnộibộ để giám sát trạng thái hiệntạicủa
Sử
dụng
một
mô
hình
nội
bộ
để
giám
sát
trạng
thái
hiện
tại
kiện
-
hành
động
)
action (hành động gầnnhất)
state
←
UPDATE
-
STATE(
state
action
percept
)
state
←
UPDATE
-
STATE(
state
,
action
,
percept
)
rule ← RULE-MATCH(state, rules)
action ← RULE-ACTION[rule]
23
Trí tuệ nhân tạo
tử
dựa
trên
mục
tiêu
Theo dõi trạng thái hiện tại của môi trường
L
ưu
g
i
ữ
m
ột
tập
các
m
ục
t
i
êu
(cầ