slike bài giảng trí tuệ nhân tạo - nguyễn nhật quang chương 2 tác tử - định nghĩa - Pdf 23

Trí Tuệ Nhân Tạo
Nguyễn Nhật Quang
[email protected]
Trường Đại học Bách Khoa Hà Nội
Viện Công nghệ Thông tin và Truyền thông
Năm học 2012-2013
Nội dung môn học:
 Giới thiệu về Trí tuệ nhân tạo
 Tác tử
 Định nghĩa
 Môi trường công việc
 Các kiểu môi trườn
g
g
 Các kiểu tác tử
 Giải quyết vấn đề: Tìm kiếm, Thỏa mãn ràng buộc
 Logic và suy diễn
 Biểu diễn tri thức
ể ễ ắ ắ
 Bi

u di

n tri thức không ch

c ch

n
 Học máy
Trí tuệ nhân tạo
2


,)
g

(

)
môi trường xung quanh nó thông qua các bộ phậncảmbiến
(sensors) và hành động phù hợp theo môi trường đó thông
qua
các
bộ
phận
hoạt
động
(actuators)
qua

các
bộ
phận
hoạt
động
(actuators)
 Tác tử con người
 Các bộ phậncảmbiến: mắt, tai, và mộtsố bộ phậncơ thể khác
 Các bộ phậnhoạt động: tay, chân, miệng, và mộtsố bộ phậncơ
thể khác

Tác

động

(motors)
3
Trí tuệ nhân tạo
Tác tử và Môi trườn
g
g
 Hàm tác tử: là hàm ánh xạ từ lịch sử nhận thức tới các
hành động:
f: P* → A
 Chương trình tác tử: hoạt động (chạy) dựa trên kiến trúc
thực tế của hàm f
ế
 Tác tử = Ki
ế
n trúc + Chương trình
4
Trí tuệ nhân tạo
Ví dụ: Thế giới của máy hút bụi

Các nhậnthức
Các

nhận

thức
 Ví trí và mức độ sạch sẽ
 Ví dụ: [A, Bẩn], [B, Bẩn]
 Các hành động

]
Di chu
y
ểnsan
g
trái
[,

]
y
g
[B, Bẩn] Hút bụi
[A, Sạch], [A, Sạch] Di chuyển sang phải
[A,
Sạch
], [A,
Bẩn
]
Hút
bụi
[A,
Sạch
],

[A,

Bẩn
]
Hút
bụi

location
=

B
then

return

Left
6
Trí tuệ nhân tạo
Tác tử h
ợp
l
ý

(
1
)
ợpý()
 Tác tử cần phấn đấu để “làm đúng việc cần làm”, dựa
trên
những gì nó nhậnthức(nhậnbiết) được
và dựa
trên

những




là hành đ

n
g

g

p
cho tác

ộ g g( ợpý)
ộ gg p
tử đạt được thành công cao nhất đối với mục tiêu đặt ra
 Đánh giá hiệu quả hoạt động: là tiêu chuẩn để đánh giá
ứ độ thà h ô t h t độ ủ ộttá tử
m

c
độ

thà
n
h
c
ô
ng
t
rong
h
oạ

 Với mỗi chuỗi nhận thức có được,

Mộttáctử hợplýcầnphải
lựachọnmột hành động

Một

tác

tử

hợp



cần

phải

lựa

chọn

một

hành

động
giúp cực đại hóa tiêu chí đánh giá hiệu quả hoạt động
của tác tử đó,

,
với

tri

thức



hạn
 Vì các nhận thức có thể không cung cấp tất cả các thông tin liên
quan
ể ổ
 Các tác tử có th

thực hiện các hành động nhằm thay đ

i
các nhận thức trong tương lai, với mục đích thu được
các thôn
g
tin hữu ích
(
ví d

: thu th
ập
thôn
g
tin, khám

ki
n
h

nghiệm của tác tử đó (cùng với khả năng học và thích
nghi)
9
Trí tuệ nhân tạo
Môi trường công việc – PEAS (1)
 PEAS
 Performance measure: Tiêu chí đánh giá hiệu quả hoạt động
 Environment: Môi trường xung quanh

A
ctuators
:Cácbộ phận hành động

A
ctuators
:

Các

bộ

phận

hành

động

n c

n
phải xác định (thiết lập) các giá trị của các thành phần
của PEAS
10
Trí tuệ nhân tạo
Môi trường công việc – PEAS (2)
 Ví dụ: Thiết kế một tác tử lái xe taxi tự động
Đáh iáhiệ ả h t độ (P) t à h h

Đá
n
h
g


hiệ
u qu


h
oạ
t

độ
ng
(P)
: an
t


Đánh

giá

hiệu

quả

hoạt

động

(P):

mức

độ

sức

khỏe

của bệnh nhân, cực tiểu hóa các chi phí, các việc kiện
cáo, …
 Môi trường xung quanh (E): bệnh nhân, bệnh viện,
nhân viên y tế, …
Các bộ phận hành động (A): hiểnthị trên màn hình

Các

các

câu

hỏi
, …
12
Trí tuệ nhân tạo
Môi trường công việc – PEAS (4)
 Ví dụ: Thiết kế một tác tử nhặt đồ vật
 Đánh giá hiệu quả hoạt động (P): tỷ lệ (bao nhiêu
phần trăm) các đồ vật được đặt vào đúng các thùng
 Môi trường xung quanh (E): dây chuyền chuyển
động trên đó có các đồ vật, các thùng đựng
 Các bộ phận hành động (A): cánh tay và bàn tay
được kết nối
 Các bộ phận cảm biến (S): máy quay (camera), các
bộ cảm biến các góc độ (các hướng)
13
Trí tuệ nhân tạo
Môi trường công việc – PEAS (5)
 Ví dụ: Thiết kế một tác tử dạy tiếng Anh tương tác
 Đánh giá hiệu quả hoạt động (P): cực đại hóa điểm
thi tiếng Anh của học viên
 Môi trường xung quanh (E): một nhóm học viên

Các bộ phận hành động (A): hiểnthị màn hình các

Các


cảm

biến

(S):

bàn

phím
14
Trí tuệ nhân tạo
Môi trường công việc – PEAS (6)
 Ví dụ: Thiết kế một tác tử lọc thư rác (spam emails
filt i )
filt
er
i
ng
)
 Đánh giá hiệu quả hoạt động (P): khả năng lọc thư
á( tf fl iti fl ti )
r
á
c
(
amoun
t
o
f
error:


một

phần)?
 Các bộ cảm biến của một tác tử cho phép nó truy cập tới trạng
thái đầy đủ của môi trường tại mỗi thời điểm
 Xác định (hay ngẫu nhiên)?
 Trạng thái tiếp theo của môi trường được xác định hoàn toàn dựa
tê t thái hiệ t iàhàhđộ ủ tá tử (t it thái hiệ
t
r
ê
n
t
rạng
thái

hiệ
n
t

i
v
à


n
h

độ

 L

ch sử kinh n
g
hi

mcủatáctửđư

c chia thành các
g
iai đo

n

g ệ

g

(chương/hồi)
 Mỗigiaiđoạn bao gồmviệcnhậnthứccủatáctử và hành động
mà nó th

chi

n


 Ở mỗigiaiđoạn, việclựachọn hành động để thựchiệnchỉ phụ
thuộc vào giai đoạn đó (không phụ thuộcvàocácgiaiđoạn khác)
 Tĩnh (hay động)?


tử
đ
lẻ
(h
đ

tử
)?


c
tử
đ
ơn
lẻ
(h
ay
đ
a

c
tử
)?
 Mộttáctử hoạt động độclập (không phụ thuộc / liên hệ vớicác
tác
tử
khác
)
trong

không
Phân
đoạn
?

không
không
không
Tĩnh? bán động có không
Rờirạc? có có không

tử
đ
?
khô
khô
khô

c
tử
đ
ơn
?
khô
ng
khô
ng
khô
ng
 Kiểu củamôitrường có ảnh hưởng quyết định đốivới

đ

i(động), liên tục, đatáctử
19
Trí tuệ nhân tạo
Các kiểu tác tử
 4 kiểu tác tử cơ bản
 Tác tử phản xạ đơn giản (simple reflex agents)
Tá tử hả d tê ôhì h( d l
bdfl


c
tử
p
hả
n xạ
d
ựa
t
r
ê
n m
ô


n
h

(

ột
tắ
(
l ật
)
ó
điề
kiệ

h


n
h
độ
ng
th
eo m
ột
quy
tắ
c
(
l
u
ật
)
c
ó
điề


Sử dụng mộtmôhìnhnộibộ để giám sát trạng thái hiệntạicủa

Sử

dụng

một



hình

nội

bộ

để

giám

sát

trạng

thái

hiện

tại

kiện
-
hành
động
)
action (hành động gầnnhất)
state

UPDATE
-
STATE(
state
action
percept
)
state

UPDATE
-
STATE(
state
,
action
,
percept
)
rule ← RULE-MATCH(state, rules)
action ← RULE-ACTION[rule]
23
Trí tuệ nhân tạo

tử

dựa

trên

mục

tiêu
 Theo dõi trạng thái hiện tại của môi trường
 L
ưu

g
i

m
ột

tập

các
m
ục

t
i
êu

(cầ


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status