TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
***
BÀI TẬP LỚN MÔN
HỆ CƠ SỞ TRI THỨC
Đề tài: Người mua hàng thông thái
Nhóm sinh viên thực hiện:
Họ và tên: SHSV:
Đặng Trọng Đức 20090778
Nguyễn Ngọc Đạt 20090676
Phạm Văn Đông 20090762
Nguyễn Văn Tiến Thành 20092441
Chu Thị Thịnh 20092587
Giảng viên hướng dẫn: Phạm Văn Hải
Hà Nội, 09 – 2012
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
MỤC LỤC
MỤC LỤC 2
LỜI NÓI ĐẦU 3
1.Mục đích 4
2.Phạm vi 5
3.Các sự kiện, ngữ cảnh, cách biểu diễn tri thức 5
Sơ đồ tổng quát 5
3.1.Các sự kiện, ngữ cảnh 5
3.2.Cách biểu diễn tri thức Tham khảo tại [2] 6
Biểu diễn tri thức bởi các luật sản xuất 6
4.Động cơ suy điễn, các luật và diễn giải của các luật 9
4.1.Động cơ suy diễn, cách diễn giải các luật 9
B.Xử lý với các sự kiện không chắc chắn: 10
4.2.Các luật 12
4.3.Giải thích các file đính kèm 13
tác giả trình bày trong các tác phẩm đó đã giúp chúng em rất nhiều để hoàn thành báo
cáo này.
3
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
1. Mục đích
Xây dựng hệ chuyên gia hỗ trợ người dùng trong việc lựa chọn các sản phẩm theo
nhu cầu.
Bằng kiến thức đầu vào là các thông tin về:
- Độ tuổi
- Giới tính
- Loại nghề nghiệp
- Sở thích
- Tình trạng bệnh lý
- …
Hệ thống sẽ đưa ra các gợi ý về:
- Các loại thực phẩm nên ăn: kết quả trả về là tên loại thực phẩm như: rau cải,
rau muống, cá biển, cà chua, gấc, …
- Đưa ra giá trị dinh dưỡng trong các loại thực phẩm đó để người dùng có thêm
kiến thức về giá trị dinh dưỡng có trong các loại thực phẩm mà hệ thống đã
gợi ý. (Tạo lòng tin đối với người dùng)
- Các loại Vitamin để giúp cơ thể phát triển khỏe mạnh.
Ví dụ: Trẻ hơn 6 tháng tuổi và dưới 1 tuổi:
Tham khảo tại [3]
o Uống nước ép Cà rốt
Giải thích vì sao uống nước ép Cà rốt: Uống một lượng nhất định
nước ép cà rốt tươi mỗi ngày, sẽ giúp trẻ khỏe và linh hoạt hơn.
Nước ép cà rốt có thể làm tăng sự thèm ăn và chống nhiễm
trùng. Đặc biệt, bà mẹ mới sinh và đang cho con bú, một cốc
nước ép cà rốt/ngày, sẽ có nhiều Sữa hơn.
Vì cà rốt rất giàu vitamin A nên nước ép cà rốt sẽ nuôi dưỡng và
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
Tập các sự kiện: F = {f
1
, f
2
, f
3
, …, f
m
}
Các sự kiện của tập F: về tuổi, giới tính, …
- f
1
: tuổi < 6 tháng
- f
2
: tuổi > 6 AND tuổi <= 8 tháng
- f
3
: tuổi > 8 AND tuổi <= 10 tháng
- f
4
: tuổi > 10 AND tuổi <= 12 tháng
- f
5
: Tuổi > 1 năm AND Tuổi <= 3 năm
- f
6
: tuổi = 6
- f
chuyên gia một cách dễ dàng.
6
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
- Khả năng diễn giải dễ dàng (explanation facilities). Dễ dàng dùng luật để diễn
giải vấn đề nhờ các tiền đề đặc tả chính xác các yếu tố vận dụng luật, từ đó
rút ra được kết quả.
- Tương tự quá trình nhận thức của con người. Dựa trên các công trình của
Newell và Simon, các luật được xây dựng từ cách con người giải quyết vấn đề.
Cách biểu diễn luật nhờ IF THEN đơn giản cho phép giải thích dễ dàng cấu trúc
tri thức cần trích lọc.
Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ
thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề thỏa mãn các
sự việc.
Các luật sản xuất thường được viết dưới dạng IF THEN. Có hai dạng:
IF < điều kiện > THEN < hành động >
hoặc
IF < điều kiện > THEN < kết luận > DO < hành động >
Tuỳ theo hệ chuyên gia cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn mỗi
luật có dạng Rule: tên. Sau phần tên là phần IF của luật.
Phần giữa IF và THEN là phần trái luật (LHS: Left - Hand -Side), có nội dung được
gọi theo nhiều tên khác nhau, như tiền đề (antecedent), điều kiện (conditional part),
mẫu so khớp (pattern part).
Phần sau THEN là kết luận hay hậu quả(consequent). Một sốhệchuyên gia có
thêm phần hành động (action) được gọi là phần phải luật(RHS: Right - Hand -Side).
Ví dụ:
Rule: Đèn đỏ
IF
Đèn đỏsáng
THEN
MYCIN hệ thống chẩn đoán bệnh viêm màng não và hiện tượng có vi khuẩn bất thường
trong máu (nhiễm trùng)
IF
Tại vị trí vết thương có máu, AND
Chưa biết chắc chắn cơ quan bị tổn thương, AND
Mở đầu 17
Chất nhuộm màu âm tính, AND
Vi khuẩn có dạng hình que, AND
Bệnh nhân bị sốt cao
THEN
Cơ quan có triệu chứng (0.4) nhiễm trùng
8
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
4. Động cơ suy điễn, các luật và diễn giải của các luật
4.1. Động cơ suy diễn, cách diễn giải các luật
Đầu vào: Người dùng nhập vào thông tin: Tuổi, Bệnh / Triệu chứng (nếu có), Công việc
Đầu ra: Danh sách thực phẩm mà người dùng nên ăn trong một tuần.
A. Quá trình xử lý của hệ thống:
Bước 1: Tạo ra vector dinh dưỡng cần cung cấp để đáp ứng yêu cầu
Tuổi DinhDuongCan1 (v
1
A,v
2
B,v
3
C,v
4
D,v
5
E,v
D,v
5
E,v
6
Protein,v
7
ChatBeo,v
8
Carbohydrate,v
9
ChatXo,v
10
Cholesterol,v
11
Canxi,v
12
Photpho,v
13
Sắt,v
14
Natri,v
15
Kali,v
16
Beta-catoten)
Công việcDinhDuongCan3 (v
1
A,v
2
B,v
Thực phẩm 1 (g) DinhDuongDapUng (v
1
A,v
2
B,v
3
C,v
4
D,v
5
E,v
6
Protein,v
7
ChatBeo,v
8
Carbohydrate,v
9
ChatXo,v
10
Cholesterol,v
11
Canxi,v
12
Photpho,v
13
Sắt,v
14
Natri,v
15
14
Natri,v
15
Kali,v
16
Beta-catoten).
Thực phẩm 3 (g) DinhDuongDapUng (v
1
A,v
2
B,v
3
C,v
4
D,v
5
E,v
6
Protein,v
7
ChatBeo,v
8
Carbohydrate,v
9
ChatXo,v
10
Cholesterol,v
11
Canxi,v
12
ChatXo,v
10
Cholesterol,v
11
Canxi,v
12
Photpho,v
13
Sắt,v
14
Natri,v
15
Kali,v
16
Beta-catoten).
ThucPhamTrongTuan(TP
1
, TP
2
,…, TP
k
) (g) (1)
Trong đó:
TP
k
cho biết lượng thực phẩm của loại k là gì và bao nhiêu gam.
Để thực hiện quá trình chuyển từ vế trái sang vế phải của (1). Ta giải quyết bài toán cái
túi, như sau:
- Mỗi đồ vật tương ứng với mỗi loại thực phẩm, với trọng lượng ứng với vector
DinhDuongDapUng cua loại thực phẩm đó.
điều chỉnh cho thích hợp. Ví dụ, có 100 người có triệu chứng đau măt, nhưng có trên 50
vẫn chưa có dấu hiệu hết hoặc giảm triệu chứng, thì ta cần tăng lượng vitamin A của
vector DinhDuongCan của triệu chứng đau mắt này.
Chúng tôi đề xuất cơ chế điều chỉnh đối với Tuổi và Công việc theo một nhóm, và của
Bệnh (Triệu chứng) theo một nhóm.
Đối với Tuổi và Công việc, xét 100 người thực hiện theo chế độ dinh dưỡng ứng với cặp
tuổi và công việc (Ví dụ 20-30 tuổi và Làm việc nhiều với máy tính, ta được 1 cặp):
- Nếu ít hơn 25 người mắc các Bệnh (hoặc có các triệu chứng) có nguồn gốc từ việc
thiếu 1 hoặc 1 nhóm các thành phần dinh dưỡng (A, B, C, Sắt, Canxi, …) nào đó,
thì vẫn giữ nguyên vector DinhDuongCan hiện thời.
- Nếu bằng hoặc hơn 25 người và ít hơn 75 người mắc các Bệnh (hoặc có các triệu
chứng) có nguồn gốc từ việc thiếu 1 hoặc 1 nhóm các thành phần dinh dưỡng (A,
B, C, Sắt, Canxi, …) nào đó, thì ta tiến hành tăng lượng dinh dưỡng thành phần
của 1 hoặc nhóm các dinh dưỡng thành phần ở vector DinhDuongCan hiện thời.
Độ tăng là một hằng số tùy vào có bao nhiêu người mắc bệnh (số lượng người cụ
thể dao động từ khoảng 25 đến 75 người);
- Nếu bằng hoặc hơn 75 người người mắc các Bệnh (hoặc có các triệu chứng) có
nguồn gốc từ việc thiếu 1 hoặc 1 nhóm các thành phần dinh dưỡng (A, B, C, Sắt,
Canxi, …) nào đó, thì ta tiến hành theo dõi những người này, và tăng thêm lượng
dinh dưỡng thành phần theo hàng tuần, cho đến khi bệnh ( triệu chứng) giảm
hoặc hết hoàn toàn. Sau đó, với mỗi người, ta sẽ nhận được vector
DinhDuongCan phù hợp với chính người đó. Ta lấy trung bình các vector
DinhDuongCan của những người này và của vector DinhDuongCan hiện thời, để
thay thế cho vector DinhDuongCan hiện thời.
Đối với Bệnh (Triệu chứng), xét 100 người thực hiện theo chế độ dinh dưỡng ứng với
mỗi Bệnh (Triệu chứng) (Ví dụ, triệu chứng mỏi mắt).
11
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
- Nếu ít hơn 25 người vẫn không giảm bệnh (triệu chứng), thì vẫn nguyên vector
DinhDuongCan hiện thời.
Bổ sung = Loại 2
12
Báo cáo giữa kì môn Hệ cơ sở tri thức Nhóm 21
THEN
Rau xanh, trái cây tươi AND Thực phẩm = Loại 1 AND
Uống nhiều nước AND Thực phẩm = Loại 2 AND
Các loại ngũ cốc AND Thực phẩm = Loại 3 AND
Sữa, trứng AND Thực phẩm = Loại 4
Tập luật: thực phẩm
IF
Thực phẩm = Loại 2
THEN
Nước khoáng có bicarbonate, nước sắc lá xakê.
4.3. Giải thích các file đính kèm
Giải thích các sheet trong file excel:
File: rule.xlsx
- rule.xlsx – rules: chứa các tập luật.
- rule.xlsx – Benhly: là file chứa các loại bệnh cần phải chú ý đến nhu cầu dinh
dưỡng (thói quen ăn uống ảnh hưởng đến sức khỏe)
o Cơ chế tập luật là:
IF
“tên bệnh”
THEN
bổ sung “tên vitamin” AND hạn chế AND tránh AND lời khuyên
- rule.xlsx – Bangdinhduong: chứa bảng thực phẩm – độ dinh dưỡng có trong
thực phẩm đó.
Tham khảo tại [4]
o Cơ chế tập luật là:
IF “tên thực phẩm” THEN “danh sách dinh dưỡng đáp ứng”
- rule.xlsx – Vitamin-Tacdung: chứa các bản ghi về Các loại vitamin và công
xử lý, suy ra kết luật có ích để trả về người dùng, đồng thời nó lưu vết những
thông tin liên quan đến quá trình suy diễn vào bộ nhớ tạm thời, để có thể đáp
ứng yêu cầu giải thích của người dùng.
- Temporary Memory: Chứa những thông tin cần thiết để người dùng có thể
biết quá trình xử lý của hệ thống, cũng như vì sao kết quả trả ra lại có ích đối
với họ.
- Explanation Mechanism: Hệ giải thích giúp cho người dùng có thể hiểu được
cách suy luận của hệ thống để có thể đưa ra kết luận cuối cùng.
Hệ thống này sẽ có các luồng sự kiện như sau:
1. Người dùng nhận sự hỗ trợ, tư vấn của hệ thống từ thông tin đầu vào là tuổi,
bệnh / triệu chứng, công việc:
- Người dùng nhập vào Tuổi, Bệnh/ Triệu chứng, Công việc
- Controller nhận yêu cầu, chuyển cho bộ Inference Engine để xử lý
- Inference Engine sử dụng tập sự kiện, và tập luật từ Knowledge Base để suy
diễn ra kết quả cần thiết để đáp ứng yêu cầu người dùng. Sau đó nó trả lại kết
quả cho Controller, đồng thời chuyển những thông tin cần cung cấp thêm đến
Temporary Memory
- Controller chuyển kết quả cho người dùng, và chờ đợi các yêu cầu tiếp theo.
2. Người dùng đưa ra yêu cầu giải thích rõ hơn cho kết quả mà hệ thống trả về
- Sau khi có kết quả trả về từ Controller (đúng hơn là từ Inference Engine),
người dùng có thể yêu cầu hệ thống cung cấp thông tin để người dùng có thể
hiểu quá trình suy diễn, cũng giải thích để người dùng có thể tin cậy vào kết
quả nhận được.
- Explanation Mechanism nhận yêu cầu của người dùng thông qua Controller.
Sau đó nó truy cập Temporary Memory để lấy các thông tin giải thích, chuyển
cho Controller
- Controller hiển thị những thông tin giải thích nhận được từ Explanation
Mechanism cho người dùng.
3. Người kĩ sư tri thức (các chuyên gia) sẽ cập nhật (thêm, sửa, xóa) cơ sở tri thức,
bao gồm cập nhật cả tập sự kiện và tập luật.