Bài tập nhóm hệ cơ sở tri thức đề tài hệ học - Pdf 23

TRƯỜNG ĐẠI HỌC NHA TRANG
KHOA CÔNG NGHỆ THÔNG TIN
*
BÀI TẬP NHÓM
HỆ CƠ SỞ TRI THỨC
Đề tài:
HỆ HỌC
Giảng viên hướng dẫn:
Bùi Đức Dương
Sinh viên thực hiện: Lớp: 52CNTT

Năm 2013
Tống Đức Nam – 52131893
Nguyễn Thị Ngọc – 52131898
Trần Thị Trầm – 52131924
Nguyễn Thị Ánh Trúc – 52131927
Trần Thị Như Ý – 52131944
Bài tập nhóm - Học phần Hệ cơ sở tri thức
MỤC LỤC
LỜI GIỚI THIỆU
Từ khi các hệ cơ sở trí thức ra đời cho đến nay, người ta không ngừng thực hiện các
công trình nghiên cứu để đưa tư tưởng nghiên cứu cùng với máy tính ứng dụng vào giải quyết
các công việc trong thực tiễn đời sống.
Một trong những nguyên nhân làm cho các hệ cơ sở tri thức phổ biến trong thời đại
hiện nay là việc làm cho máy tính trở nên thông minh hơn, nói cụ thể hơn là người ta tìm cách
tạo ra các chương trình thông minh hơn có khả năng giải quyết các vấn đề thực tế như cách
giải quyết của con người. việc học chương trình máy tính ngày càng biến hóa và phát triển
thích ứng với môi trường và yêu cầu phức tạp của xã hội hiện nay.

– Học từ dữ liệu số: được áp dụng cho những hệ thống được mô hình dưới dạng số liên
quan đến các kỹ thuật nhằm tối ưu các tham số. Học theo dạng số bao gồm mạng Neural nhân
t ạo, thuật giải di truyền, bài toán tối ưu truyền thống. Các kỹ thuật học theo số không tạo ra
CSTT tường minh.
Quá trình học diễn ra dưới nhiều hình thức như:
3
Hệ học
3
Bài tập nhóm - Học phần Hệ cơ sở tri thức
1. Học vẹt:
Hệ tiếp nhận các khẳng định của các quyết định đúng. Khi hệ tạo ra một quyết định
không đúng, hệ sẽ đưa ra các luật hay quan hệ đúng mà hệ đã sử dụng. Hình thức học vẹt
nhằm cho phép chuyên gia cung cấp tri thức theo kiểu tương tác.
2. Học bằng cách chỉ dẫn:
Thay vì đưa ra một luật cụ thể cần áp dụng vào tình huống cho trước, hệ thống sẽ được
cung cấp bằng các chỉ dẫn tổng quát. Ví dụ: "gas hầu như bị thoát ra từ van thay vì thoát ra từ
ống dẫn". Hệ thống phải tự mình đề ra cách biến đổi từ trừu tượng đến các luật khả dụng.
3. Học bằng qui nạp:
Hệ thống được cung cấp một tập các ví dụ và kết luận được rút ra từ từng ví dụ. Hệ
liên tục lọc các luật và quan hệ nhằm xử lý từng ví dụ mới.
4. Học bằng tương tự:
Hệ thống được cung cấp đáp ứng đúng cho các tác vụ tương tự nhưng không giống
nhau. Hệ thống cần làm thích ứng đáp ứng trước đó nhằm tạo ra một luật mới có khả năng áp
dụng cho tình huống mới.
5. Học dựa trên giải thích:
Hệ thống phân tích tập các lời giải ví dụ (và kết quả) nhằm ấn định khả năng đúng
hoặc sai và tạo ra các giải thích dùng để hướng dẫn cách giải bài toán trong tương lai.
6. Học dựa trên tình huống:
Bất kỳ tính huống nào được hệ thống lập luận đều được lưu trữ cùng với kết quả cho
dù đúng hay sai. Khi gặp tình huống mới, hệ thống sẽ làm thích nghi hành vi đã lưu trữ với

B Có gai Xanh Cứng Lớn Không
C Nhẵn Đỏ Mềm Lớn Có
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
J Có gai Đỏ Cứng Lớn Không
5
Hệ học
Thử
Xây dựng
5
Bài tập nhóm - Học phần Hệ cơ sở tri thức
K Nhẵn Nâu Mềm Lớn Không
L Nhẵn Xanh Mềm Nhỏ Có
M Có gai Đỏ Mềm Nhỏ Không
N Nhẵn Đỏ Cứng Lớn Có
O Nhẵn Đỏ Cứng Nhỏ Không
P Có gai xanh Cứng Nhỏ Có
Hình 1. Bảng 1Bảng số liệu Cây có độc hay không
Ta có kết quả
Hình 2. Hình 1Cây định danh có độc hay không
III. THUẬT TOÁN QUINLAN:
Là thuật toán học theo quy nạp dùng luật, đa mục tiêu.
- Do Quinlan đưa ra năm 1979.
- Ý tưởng: Chọn Thuộc tính quan trọng nhất để tạo cây quyết định.
- Thuộc tính quan trọng nhất là Thuộc tính phân loại Bảng quan sát thành các bảng
con sao cho từ mỗi bảng con này dễphân tích để tìm quy luật chung.

: tổng số phần tử trong phân hoạch có Thuộc tính A là j.
- T(j,r1)+T(j,r2)+…+T(j,rn)=1
Vector đơn vị nếu nó có duy nhất một thành phần có giá trị 1 và những thành phần
khác có giá trị 0.
- Thuộc tính được chọn để phân hoạch là Thuộc tính cá nhiều vector đơn vị nhất.
2. Ví dụ:
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
C Nhẵn Đỏ Mềm Lớn Có
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
L Nhẵn Xanh Mềm Nhỏ Có
M Có gai Đỏ Mềm Nhỏ Không
N Nhẵn Đỏ Cứng Lớn Có
7
Hệ học
7
Bài tập nhóm - Học phần Hệ cơ sở tri thức
O Nhẵn Đỏ Cứng Nhỏ Không
P Có gai xanh Cứng Nhỏ Có
Hình 3. Bảng 2Bảng số liệu cây có độc hay không
Thuộc tính Vỏ (2 giá trị):
V

Kích thước
(Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (4/9;5/9);
Số vectơ đơn vị : 0
Chọn Thuộc tính Màu làm Thuộc tính phân hoạch.
8
Hệ học
8
Bài tập nhóm - Học phần Hệ cơ sở tri thức
Hình 4. Hình 2Cây định danh thuộc tính Màu
♦ Bảng theo Thuộc tính màu xanh:
Màu Tên Vỏ Bên trong Kích thước Độc
Xanh B Có gai Cứng Lớn Không
Xanh D Có gai Mềm Lớn Không
Xanh H Có gai Mềm Nhỏ Có
Xanh I Nhẵn Cứng Nhỏ Có
Xanh L Nhẵn Mềm Nhỏ Có
Xanh P Có gai Cứng Nhỏ Có
Hình 5.
Hình 6. Bảng 3Bảng theo thuộc tính Màu Xanh
Thuộc tính Vỏ (2 giá trị):
V
Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (2/2;0/2) = (1;0);
Số vectơ đơn vị : 1
Thuộc tính Bên trong (2 giá trị):
V
Bên trong

V
Vỏ
(Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2);
V
Vỏ
(Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (0/3;3/3) = (0;1);
Số vectơ đơn vị : 1
Thuộc tính Bên trong (2 giá trị):
10
Hệ học
10
Bài tập nhóm - Học phần Hệ cơ sở tri thức
V
Bên trong
(Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (1/2;1/2);
V
Bên trong
(Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (1/5;4/5);
Số vectơ đơn vị : 0
Thuộc tính Kích thước (2 giá trị):
V
Kích thước
(Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (2/3;1/3);
V
Kích thước
(Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (0/4;4/4) = (0;1);
Số vectơ đơn vị : 1
Chọn Thuộc tính Kích thước làm Thuộc tính phân hoạch:
Hình 9. Hình 4Cây định danh thuộc tính Màu và Kích thước 2
Kích thước Tên Vỏ Bên trong Độc

Bài tập nhóm - Học phần Hệ cơ sở tri thức
Hình 12. Hình 6Cây định danh đầy đủ
3. Phát sinh tập luật:
Kết quả học:
1. If (Màu = Nâu) then (Độc = Không)
2. If (Màu = Xanh) AND (Kích thước = Lớn) then (Độc = Không)
3. If (Màu = Xanh) AND (Kích thước = Nhỏ) then (Độc = Độc)
4. If (Màu = Đỏ) AND (Kích thước = Nhỏ) then (Độc = Không)
5. If (Màu = Đỏ) AND (Kích thước = Lớn) AND (Vỏ= Nhẵn) then (Độc = Độc)
6. If (Màu = Đỏ) AND (Kích thước = Lớn) AND (Vỏ= Có gai) then (Độc = Không)
IV. HỌC THEO ĐỘ BẤT ĐỊNH
Đối với một cơ sở dữ liệu thực thì không phải lúc nào cũng cho ra một tập đồng nhất. Với
cơ sở dữ liệu này người ta cần đo độ bất định (lộn xộn) của dữ liệu, hay độ không đồng bộ
nhất trong các tập con được sinh ra.
- Độ bất định Entropy của thuộc tính Y được tính theo công thức:
Trong đó:
n
t
là tổng số phần tử có trong phân hoạch.

n
b
là tổng số phần tử có thuộc tính dẫn xuất Y có giá trị b.
n
bc
: tổng số phần tử có thuộc tính dẫn xuất Y có giá trị b và Thuộc tính
13
Hệ học
13
Bài tập nhóm - Học phần Hệ cơ sở tri thức

 E (Màu) =
+
= 0,721
- Thuộc tính Bên trong: (2 giá trị)
Tập Cứng: 3/10 bị Độc ; 7/10 Không bị độc
Tập Mềm: 3/6 bị Độc ; 3/6 Không bị độc
 E (Bên trong) =
= 0,550 + =0,925
- Thuộc tính Kích thước: (2 giá trị)
Tập Lớn: 2/7 bị Độc ; 5/7 Không bị độc
Tập Nhỏ: 4/9 bị Độc ; 5/9 Không bị độc
 E (Kích thước) =
= 0,377 + 0,557 = 0,934
Vậy ta chọn Thuộc tính Màu làm Thuộc tính phân hoạch
Hình 14. Hình 7Cây định danh Màu theo độ bất định
Ta rút ra được luật :
- Nếu Màu của quả là Nâu thì sẽ Không bị độc
Từ sơ đồ trên ta có 2 bảng:
15
Hệ học
15
Bài tập nhóm - Học phần Hệ cơ sở tri thức
Bảng 1:
Tên Màu Vỏ Bên trong Kích thước Độc
B Xanh Có gai Cứng Lớn không
D Xanh Có gai Mềm Lớn không
H Xanh Có gai Mềm Nhỏ Có
I Xanh Nhẵn Cứng Nhỏ Có
L Xanh Nhẵn Mềm Nhỏ Có
P Xanh Có gai Cứng Nhỏ có

N Đỏ Nhẵn Cứng Lớn Có
O Đỏ Nhẵn Cứng Nhỏ Có
Hình 17. Bảng 8Bảng theo thuộc tính Màu Đỏ
- Thuộc tính Vỏ (2 giá trị)
Tập Có gai: 0/3 bị Độc ; 3/3 Không bị độc
Tập Nhẵn: 2/4 bị Độc ; 2/4 Không bị độc
 E (Vỏ) =
,571
- Thuộc tính Bên trong (2 giá trị)
Tập Mềm: 1/2 bị Độc ; 1/2 Không bị độc
Tập Cứng: 1/5 bị Độc ; 4/5 Không bị độc
 E (Bên trong) =
= 2/7 +0,515 = 0,801
- Thuộc tính Kích thước (2 giá trị )
Tập Lớn: 2/3 bị Độc ; 1/3 Không bị độc
Tập Nhỏ: 0/4 bị Độc ; 4/4 Không bị độc
 E (Kích thước) =
= 0,393
Vậy ta chọn Thuộc tính Kích thước để phân hoạch
Hình 18. Hình 9Cây định danh Kích thước theo độ bất định 2
Từ cây trên ta rút ra được luật :
- Nếu Kích thước là Nhỏ và quả có Màu Đỏ thì sẽ Không bị độc
Từ hình trên ta có bảng :
Bảng 3:
Tên Vỏ Bên trong Độc
C Nhẵn Mềm Có
17
Hệ học
17
Bài tập nhóm - Học phần Hệ cơ sở tri thức

- Tập mẫu có m mẫu, mỗi mẫu gồm k Thuộc tính, trong đó có 1 Thuộc tính quyết
định. Tổng số n giá trị của Thuộc tính này chính là số lớp của tập mẫu.
- Tập luật R có giá trị khởi tạo là ∅.
- Tất cả các dòng trong bảng ban đầu chưa được đánh dấu (kiểm tra).
2. Thuật giải ILA
- B1: Dựa vào Thuộc tính quyết định (có m giá trị), chia bảng thành m bảng con.
- B2: Xét bảng con thứ (i):
Khởi tạo biến đếm kết hợp Thuộc tính j, j=1 (Thuộc tính).
- B3: Với mỗi bảng con đang xét, phân chia danh sách các Thuộc tính theo các tổ
hợp phân biệt, mỗi tổ hợp ứng với j Thuộc tính phân biệt.
- B4: Với mỗi tổ hợp các Thuộc tính, đếm các giá trị Thuộc tính xuất hiện theo cùng
tổ hợp Thuộc tính trong các dòng chưa được đánh dấu của bảng con đang xét
(đồng thời không xuất hiện với tổ hợp Thuộc tính này trên các bảng còn lại). Gọi
tổ hợp đầu tiên (trong bảng con) có số lần xuất hiện nhiều nhất là tổ hợp lớn nhất.
- B5: Nếu tổ hợp lớn nhất bằng ∅, tăng j lên 1 và quay lại B3.
- B6: Đánh dấu các dòng thoả tổ hợp lớn nhất của bảng con đang xét.
- B7: Thêm luật mới vào tập luật R, với vế trái là tập các giá trị của Thuộc tính ứng
với tổ hợp lớn nhất (kết hợp các Thuộc tính bằng toán tử AND) và vế phải là giá
trị Thuộc tính quyết định tương ứng.
- B8: Nếu tất cả các dòng đều đã được đánh dấu thì ta thực hiện tương tự với các
bảng con còn lại (B2 -> B7). Ngược lại (nếu chưa đánh dấu hết các dòng) thì quay
lại B4. Nếu tất cả các bảng con đã được đánh dấu hết thì ta kết thúc, kết quả thu
được là tập luật cần tìm.
3. Ưu điểm của thuật giải
- Dạng các luật sẽ phù hợp cho việc khảo sát dữ liệu, mô tả mỗi lớp một cách đơn
giản để phân biệt với các lớp khác.
19
Hệ học
19
Bài tập nhóm - Học phần Hệ cơ sở tri thức

L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có
P Có gai Xanh Cứng Nhỏ Có
Hình 22. Bảng 11Bảng theo kết quả có Độc
Bảng 2:
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
20
Hệ học
20
Bài tập nhóm - Học phần Hệ cơ sở tri thức
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 23. Bảng 12Bảng theo kết quả Không độc
B2: Xét bảng 1:
Bảng 1:
Tên Vỏ Màu Bên trong Kích thước Độc
C Nhẵn Đỏ Mềm Lớn Có
H Có gai Xanh Mềm Nhỏ Có
I Nhẵn Xanh Cứng Nhỏ Có
L Nhẵn Xanh Mềm Nhỏ Có
N Nhẵn Đỏ Cứng Lớn Có
P Có gai Xanh Cứng Nhỏ Có

21
Hệ học
21
Bài tập nhóm - Học phần Hệ cơ sở tri thức
P Có gai Xanh Cứng Nhỏ Có
Hình 25. Bảng 14Bảng Có độc sau khi đánh dấu "Xanh, Nhỏ"
- R= R {Màu = Xanh AND Kích thước = Nhỏ THEN Độc = Có}.
- Quay lại kiểm tra, ta có:
{Vỏ,
Màu}
{Vỏ,
Bên trong}
{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
KíchThước}
{BênTrong,
Kích thước}
∅ ∅ ∅ ∅ ∅ ∅
- Xét j = 3 (Thuộc tính)
- Có 3 tổ hợp: {Vỏ, Màu, Bên trong}, {Vỏ, Màu, Kích thước}, {Màu, Bên trong, Kích
thước }.
{Vỏ,
Màu, Bên trong}
{Vỏ,
Màu, Kích thước}
{Màu,
Bên trong, Kích thước}

- Có 4 tổ hợp: {Vỏ}, {Màu}, {Bên trong}, {Kích thước}
{Vỏ} {Màu} {Bên trong} {Kích thước}

Nâu (3)
∅ ∅
- Tổ hợp lớn nhất: {Màu} = “Nâu”.
- Đánh dấu dòng có {Màu} = “Nâu”.
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 28. Bảng 17Bảng Không độc sau khi đánh dấu "Nâu"
- R = R { Màu = Nâu THEN Độc = Không}.
- Quay lại kiểm tra:
{Vỏ} {Màu} {Bên trong} {Kích thước}
∅ ∅ ∅ ∅
- Xét j=2 (Thuộc tính).
- Có 6 tổ hợp: {Vỏ, Màu}, {Vỏ, Bên trong}, {Vỏ , Kích thước}, {Màu, Bên trong},
{Màu, Kích thước}, {Bên trong, Kích thước}.
{Vỏ,
Màu}
{Vỏ,
Bên trong}

- Quay lại kiểm tra:
{Vỏ,
Màu}
{Vỏ,
Bên trong}
{Vỏ,
Kích thước}
{Màu,
Bên trong}
{Màu,
KíchThước}
{BênTrong,
Kích thước}
Có gai, Đỏ (1) ∅ Có gai, Lớn (3) ∅ Xanh, Lớn (2) ∅
- Tổ hợp lớn nhất :{Vỏ, Kích thước} = “Có Gai, Lớn”
- Đánh dấu dòng có {Vỏ, Kích thước} = “Có Gai, Lớn”
Tên Vỏ Màu Bên trong Kích thước Độc
A Có gai Nâu Cứng Lớn Không
B Có gai Xanh Cứng Lớn Không
D Có gai Xanh Mềm Lớn Không
E Có gai Đỏ Cứng Nhỏ Không
F Nhẵn Đỏ Cứng Nhỏ Không
G Nhẵn Nâu Cứng Nhỏ Không
J Có gai Đỏ Cứng Lớn Không
K Nhẵn Nâu Mềm Lớn Không
M Có gai Đỏ Mềm Nhỏ Không
O Nhẵn Đỏ Cứng Nhỏ Không
Hình 30. Bảng 19Bảng Không độc sau khi đánh dấu “Nâu”, “Đỏ, Nhỏ”, “Có gai, Lớn”
- R = R {Vỏ = Có gai AND Kích thước= Lớn THEN Độc = Không}.
- Đánh dấu hết dòng AND xét hết bảng con => kết thúc.

xử lý và luật học.
+ Mô hình kết nối : Có hai mô hình kết nối đó là kết nối truyền thẳng và kết nối hồi
quy. Mô hình kết nối truyền thẳng được gọi là mạng truyền thẳng đó là cấu trúc mạng được
kết nối chuyển tiếp tín hiệu từ lớp vào thông qua lớp ẩn và đến lớp ra. Mô hình kết nối hồi
quy được gọi là mạng hồi quy đó là cấu trúc mạng được kết nối chuyển tiếp tín hiệu từ lớp
vào thông qua lớp ẩn đến lớp ra và đồng thời hồi tiếp tín hiệu về đơn vị xử lý chính nó hoặc
các đơnvị xử khác trong lớp hoặc ở lớp khác. + Đơn vị xử lý : Một mạng neuron nhân tạo có
nhiều lớp đó là lớp vào, các lớp ẩn và lớp ra. Lớp vào chứa các neuron được xem như nơi
25
Hệ học
25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status