XÂY DỰNG HỆ CHUYÊN GIA TƯ VẤN CHO NGƯỜI DÙNG HỌC TIẾNG ANH - Pdf 26

Biểu diễn tri thức và ứng dụng 2012
MỤC LỤC
L I CÁM NỜ Ơ 1
L I M UỜ Ở ĐẦ 2
GI I THI UỚ Ệ 4
PH N 1: C S LÝ LU NẦ Ơ Ở Ậ 5
1.2 H c s tri th c:ệ ơ ở ứ 11
1.2.1 Phân lo i tri th c:ạ ứ 11
1.2.3 Các k thu t bi u di n tri th c:ỹ ậ ể ễ ứ 13
1.2.3.1 Bi u di n tri th c b ng b ba OAV (Object – Attribute – Value):ể ễ ứ ằ ộ 13
1.2.3.2 Bi u di n tri th c b ng lu t s n xu t:ể ễ ứ ằ ậ ả ấ 13
1.2.3.3 Bi u di n tri th c b ng m ng ng ngh a:ể ễ ứ ằ ạ ữ ĩ 14
1.2.3.4 Bi u di n tri th c b ng Frame:ể ễ ứ ằ 14
1.2.3.5 Bi u di n tri th c b ng Logic:ể ễ ứ ằ 14
1.3 Khái ni m v h chuyên gia:ệ ề ệ 16
1.3.1 c tr ng c a h chuyên giaĐặ ư ủ ệ 17
1.3.2 Suy di n trong h chuyên gia:ễ ệ 20
1.3.2.1 Suy di n ti n:ễ ế 20
1.3.2.2 Suy di n lùi:ễ 21
1.3.2.3 Chi n l c gi i quy t đ ng đ trong quá trình suy di n:ế ượ ả ế ụ ộ ễ 21
1.3.2.4 H chuyên gia m (Fuzzy Expert System):ệ ờ 22
1.3.3 Bi u di n tri th c trong các h chuyên giaể ễ ứ ệ 23
1.3.3.1 Logic m nh đ :ệ ề 23
1.3.3.2 Logic v t :ị ừ 23
PH N 2: XÂY D NG H CHUYÊN GIA T V N CHO NG I DÙNG H C TI NGẦ Ự Ệ Ư Ấ ƯỜ Ọ Ế
ANH 26
2.1 Gi i thi u h th ng:ớ ệ ệ ố 26
2.2 Phân tích: 26
2.3 Ki n trúc h th ngế ệ ố 27
28
2.5 Mã ngu n h th ng t v n h c Anh v n:ồ ệ ố ư ấ ọ ă 29

phong phú. Chúng ta thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn và
do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học
máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp
được núi dữ liệu hiện có và tìm ra những đặc trưng thiết yếu cần có để phục vụ
cho lợi ích của con người. Những cách tiếp cận này phải có thể xử lí những lượng
lớn dữ liệu trong thời gian nhanh và loại bỏ những dữ liệu không liên quan hay
không chính xác để trích xuất ra những thông tin, tri thức quý báu cho chúng ta.
Trong bối cảnh thông tin đang bùng nổ như hiện nay. Khai thác và ứng dụng
thông tin sao cho có hiểu quả là điều cần thiết. Các cơ quan, tổ chức đều mong
muốn có được càng nhiều thông tin về lĩnh vực mình hoạt động càng tốt: các
khách hàng tiềm năng, hoạt động cạnh tranh giữa các công ty, biến động của thị
trường…
Ngoài ra, thông tin cũng sẽ không giúp ích được nhiều nếu như người nắm giữ
thông tin không biết khai thác nó. Bản thân thông tin mang những hiện tượng và
xu hướng phổ biến. Nếu nắm được các hiện tượng, xu hướng phổ biến này, chúng
sẽ hoạt động hiệu quả nhất trong tất cả các lĩnh vực như kinh tế, xã hội, chính
trị…,vì ai có được thông tin và khai thác thông tin nhanh chính xác và hiệu quả
nhất sẽ là người chiến thắng.
Tuy nhiên, trong thời đại của công nghệ thông tin nơi mà dữ liệu đa dạng và
phong phú. Người dùng thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn
và do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học
máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp,
biểu diễn được lượng dữ liệu vô tận hiện có và tìm ra những đặc trưng thiết yếu
cần có để phục vụ cho lợi ích của người dùng. Những cách tiếp cận này phải có
thể xử lí những lượng lớn dữ liệu trong thời gian nhanh và loại bỏ những dữ liệu
không liên quan hay không chính xác để trích xuất ra những thông tin, tri thức quý
báu cho chúng ta.
3 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

trọng trong việc phát triển Công nghệ thông tin, nâng cao sự hữu dụng của máy
tính, giúp con người gần gũi với máy tính hơn. Ngoài ra, biểu diễn tri thức còn góp
phần thúc đẩy nhiều ngành khoa học khác phát triển, khả năng phát triển khoa học
dựa trên tri thức liên ngành.

PHẦN 1: CƠ SỞ LÝ LUẬN
5 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
1.1 Biểu diễn tri thức
1.1.1 Giới thiệu về biểu diễn tri thức
Biểu diễn tri thức (KR) là một lĩnh vực nghiên cứu trí tuệ nhân tạo nhằm mục đích
đại diện cho kiến thức trong các biểu tượng để tạo điều kiện suy ra từ những yếu
tố kiến thức, tạo ra những yếu tố mới của kiến thức. KR có thể được thực hiện cho
được độc lập của mô hình kiến thức cơ bản hoặc hệ thống cơ sở tri thức (KBS)
như một mạng lưới ngữ nghĩa.
Biểu diễn tri thức (KR) nghiên cứu liên quan đến phân tích làm thế nào để lý do
chính xác và hiệu quả và làm thế nào tốt nhất để sử dụng một tập hợp các biểu
tượng đại diện cho một tập hợp các sự kiện trong một lĩnh vực kiến thức. Vốn từ
vựng biểu tượng và một hệ thống logic được kết hợp để cho phép suy luận về các
yếu tố trong KR để tạo mới câu KR. Logic được sử dụng để cung cấp ngữ nghĩa
chính thức của chức năng có lý nên được áp dụng cho các biểu tượng trong hệ
thống KR. Logic là cũng được sử dụng để xác định các toán tử có thể xử lý như
thế nào và thay đổi hình dáng kiến thức. Ví dụ các toán tử bao gồm: phủ định, kết
hợp, trạng từ, tính từ, lượng hóa và phương thức khai thác. Logic là lý thuyết giải
thích. Những yếu tố-biểu tượng, các toán tử, và giải thích lý thuyết là những gì
cung cấp cho trình tự của các biểu tượng có nghĩa là trong một KR.
Trong việc áp dụng hệ thống KR vấn đề thực tế, sự phức tạp của vấn đề có thể
vượt quá hạn chế nguồn lực, khả năng của hệ thống KR. Phát triển gần đây trong
KR bao gồm các khái niệm về Semantic Web, phát triển dựa trên ngôn ngữ XML

là chữ số La Mã.
1.1.2 Đặc điểm cơ bản về biểu diễn tri thức
7 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Bao phủ (coverage), KR bao gồm một bề rộng và chiều sâu của thông tin. Nếu
không có một phạm vi bao phủ rộng, KR không có thể xác định bất cứ điều gì
hoặc giải quyết không rõ ràng.
Dễ hiểu bởi con người. KR được xem như là một ngôn ngữ tự nhiên. Nó sẽ hỗ trợ
mô đun và phân cấp các lớp (gấu Bắc cực là gấu, là động vật).
Nhất quán. Nếu Linh mở cửa, nó cũng có thể được hiểu như là cánh cửa đã mở
cửa bởi Linh. Bằng cách phù hợp, KR có thể loại bỏ kiến thức dư thừa hoặc xung
đột.
Hiệu quả
Dễ sửa đổi và cập nhật.
Hỗ trợ các hoạt động thông minh sử dụng cơ sở tri thức.
1.1.3 Ảnh hưởng của Bản thể học (Ontology)
Bản thể học giúp xây dựng mô hình của một lĩnh vực và xác định các thuật
ngữ bên trong lĩnh vực và các mối liên hệ giữa chúng. Có nhiều kiểu khác nhau về
bản thể học bao gồm các bản thể học lĩnh vực, các bản thể học tổng quát, các bản
thể học ứng dụng, và các bản thể học tượng trưng.
Trong khi phân loại tri thức, lưu trữ, truy xuất và quản trị thông tin thì nó
không chỉ hữu ích cho việc giải quyết vấn đề không trực tiếp cần chuyên môn loài
người mà còn đưa đến các kết quả “Quản trị tri thức” cho phép một tổ chức thực
hiện chức năng một cách hiệu quả trong một thời gian dài.
1.1.4 Hướng tiếp cận biểu diễn tri thức để hiểu ngôn ngữ tự nhiên
Mô tả nghiên cứu sơ bộ hướng tiếp cận biểu diễn tri thức với việc hiểu Ngôn
ngữ tự nhiên (Natural Language Understanding - NLU). Một hệ thống máy tính
đang được phát triển để xử lý sự thu nhận, sự mô tả, và sử dụng ngôn ngữ tri thức.
8 GVHD: PGS.TS.Đỗ Văn Nhơn

Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Cách tiếp cận KR đến một tác vụ trí tuệ nhân tạo bao gồm một liên kết chặt
chẽ với một chuyên gia trong phạm vi tác vụ. Điều này đòi hỏi phải làm cho nó dễ
dàng cho các chuyên gia để thêm tri thức mới vào hệ thống máy tính, để hiểu
những tri thức gì đang có trong hệ thống, và để hiểu làm thế nào hệ thống hoàn
thành được tác vụ, vì vậy những thay đổi cần thiết và các sửa chữa dễ dàng nhận
ra và thực hiện. Cần lưu ý rằng phạm vi tác vụ của chúng ta là NLU (Natural
Language Understanding). Điều đó là, các tri thức trong hệ thống là tri thức về
NLU và chuyên gia dự định là một chuyên gia trong NLU.
Hệ thống KR chúng ta đang sử dụng là hệ thống xử lý mạng ngữ nghĩa
SNePS. Hệ thống này là một hệ thống mạng ngữ nghĩa, trong đó tất cả tri thức,
bao gồm cả quy tắc, được đặc trưng là các nút trong một mạng lưới ngữ nghĩa,
một hệ thống suy luận thực hiện lập luận theo các quy định được lưu trữ trong
mạng và một gói truy xuất cho phép người dùng đi theo lập luận của hệ thống.
Một phần chủ yếu của nghiên cứu này bao gồm việc thiết kế và thực thi một
hệ thống dựa trên SNePS được gọi là các hệ thống NL, để cho phép các chuyên
gia NLU nhập ngôn ngữ học tri thức vào mạng trong ngôn ngữ tự nhiên và để sử
dụng tri thức này cho việc xử lý văn bản bao gồm cả bổ sung tri thức NLU.
Những tính năng này phân biệt hệ thống của chúng ta từ các hệ thống dựa trên
nguyên tắc xử lý ngôn ngữ tự nhiên khác như là của Pereira và Warren và
Robinson.
Một trong những mối quan tâm chính khác là tri thức thu được, gồm cả các
quy định và xác nhận thực tế của lập luận. Vì cả hai loại tri thức được lưu trữ dưới
hình thức tương tự trong mạng ngữ nghĩa, hệ thống NL của chúng ta đang được
phát triển với khả năng xử lý các đầu vào của cả hai loại tri thức và với tri thức
mới này ngay lập tức có sẵn để sử dụng.
10 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

Biểu diễn tri thức và ứng dụng 2012
Tri thức được phân thành các loại sau:
 Tri thức thủ tục (Procedural knowledge): mô tả cách gì (How) để
giải quyết vấn đề, nó cung cấp định hướng cho cách thực hiện một cái
gì đó.
 Tri thức khai báo (Declarative knowledge): miêu tả cái gì (What)
được biết về vấn đề. Nó bao gồm các mệnh đề đơn giản đúng hoặc sai,
một dãy các mệnh đề mô tả chi tiết một đối tượng hay một khái niệm
nào đó.
 Siêu tri thức (Meta knowledge): là tri thức giúp hệ thống lấy ra các
tri thức thích hợp. Nó còn gọi là tri thức về tri thức (Knowledge about
knowledge).
 Tri thức Heuristic (Heuristic knowledge): dẫn đường cho tiến trình
lập luận. Tri thức này còn gọi là tri thức bóng (Shallow knowledge).
Nó dựa vào kinh nghiệm và tri thức có được nhờ giải quyết những vấn
đề trước đó.
 Tri thức cấu trúc (Structural knowledge): bao gồm các tập luật, đối
tượng và quan hệ giữa các đối tượng. Loại tri thức này mô tả mô hình
trí tuệ tổng quát của các chuyên gia con người.
1.2.2 Phương pháp tiếp nhận tri thức:
• Thụ động:
- Gián tiếp: Những tri thức kinh điển.
- Trực tiếp: Những tri thức kinh nghiệm (không kinh điển) do
“chuyên gia lĩnh vực” đưa ra.
• Chủ động:
- Đối với những tri thức tiềm ẩn, không rõ ràng hệ thống phải tự
phân tích, suy diễn, khám phá để có thêm tri thức mới.
12 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

nút biểu diễn đối tượng và cung biểu diễn quan hệ giữa các đối tượng.
Phương pháp này biểu diễn tri thức sử dụng đồ thị gồm các nút và các cung.
Trong đó, các nút biểu diễn các đối tượng và các cung biểu diễn mối quan hệ giữa
chúng.
Ví dụ:
Hình 1. Mạng ngữ nghĩa cho xe wave S
1.2.3.4 Biểu diễn tri thức bằng Frame:
Đây là phương pháp biểu diễn kết hợp của biểu diễn mô tả và biểu diễn thủ
tục.
1.2.3.5 Biểu diễn tri thức bằng Logic:
Trong biểu diễn tri thức bằng Logic, dạng chuẩn phổ biến cho các luật suy
dẫn là Dạng chuẩn Horn:
Một luật suy dẫn ở dạng chuẩn Horn được biểu diễn như sau:
p1∩…∩pn → q1U…Uqn
Trường hợp 1: n = 0, m = 1; Luật có dạng:
ٱ → q = F(t1,…,tk)
14 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Wave
S
Xe
máy
17
triệu
VND
97 cm
khối

Dung tích
xi lanh

Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
ٱ → q1;
ٱ → q2;

ٱ → qk;
Tập F= F(q1,…,qk) tạo nên phần giả thiết cho quá trình suy diễn
Các luật ở dạng chuẩn Horn: p1∩…∩pn → q
Logic vị từ (Predicate calculus): Cũng như Logic mệnh đề, cơ sở tri thức
của Logic vị từ được cấu thành bởi hai phần:
Tập các sự kiện F
Tập các luật R
Các sự kiện được cho bởi ٱ → qi(x, y, z, …), i = 1,…,k ở đây qi(x,y,z,…) là
các hạng từ phụ thuộc vào các hạng thức x, y, z, …
Trường hợp x, y, z là các biến, nếu chúng gắn với lượng từ “Tồn tại” thì
phải thay chúng bởi một giá trị tượng trưng hoặc thực sự.
Các luật có dạng p1(.)∩…∩pn(.) → q(.) Điều cần lưu ý là các biến tham
gia trong pi và q đều phải gắn với lượng từ “Với mọi”.
1.3 Khái niệm về hệ chuyên gia:
Theo E. Feigenbaum : “Hệ chuyên gia (Expert System) là một chương trình
máy tính thông minh sử dụng tri thức (knowledge) và các thủ tục suy luận
(inference procedues) để giải những bài toán tương đối khó khăn đòi hỏi những
chuyên gia mới giải được”.
Hoạt động của một hệ chuyên gia:
Một hệ chuyên gia bao gồm ba thành phần chính là cơ sở tri thức (knowledge
base), máy suy diễn hay mô tơ suy diễn (inference engine), và hệ thống giao tiếp
với người sử dụng (user interface). Cơ sở tri thức chứa các tri thức để từ đó, máy
suy diễn tạo ra câu trả lời cho người sử dụng thông qua hệ thống giao tiếp.
16 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương

Domain)
Biểu diễn tri thức và ứng dụng 2012
- Hiệu quả cao (high performance): khả năng trả lời với mức độ tinh thông
bằng hoặc cao hơn so với chuyên gia (người) trong cùng lĩnh vực.
- Thời gian trả lời thoả đáng (adequate response time): thời gian trả lời hợp
lý, bằng hoặc nhanh hơn so với chuyên gia (người) để đi đến cùng một quyết định.
Hệ chuyên gia là một hệ thống thời gian thực (real time system).
- Độ tin cậy cao (good reliability): không thể xảy ra sự cố hoặc giảm sút độ
tin cậy khi sử dụng.
- Dễ hiểu (understanable): hệ chuyên gia giải thích các bước suy luận một
cách dễ hiểu và nhất quán, không giống như cách trả lời bí ẩn của các hộp đen
(black box).
Kiến trúc của hệ chuyên gia
Những thành phần cơ bản của một hệ chuyên gia:
Hình 4. Những thành phần cơ bản của một hệ chuyên gia
 Cơ sở tri thức (Knowledge base). Gồm các phần tử (hay đơn vị) tri thức
thông thường được gọi là luật (Rule), được tổ chức như một cơ sở dữ
liệu.
18 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Cơ sở tri thức
Các luật
Bộ nhớ làm việc
Máy suy diễn
Lịch công việc
Khả năng giải thích
Khả năng
thu nhận tri thức
Giao diện người sử dụng
Biểu diễn tri thức và ứng dụng 2012

Hình 5. Quan hệ giữa máy suy diễn và cơ sở tri thức
Từ việc phân biệt hai loại tri thức, người ta nói máy suy diễn là công cụ triển
khai các cơ chế (hay kỹ thuật) tổng quát để tổ hợp các tri thức phán đoán và các tri
thức thực hành. Hình trên đây mô tả quan hệ hữu cơ giữa máy suy diễn và cơ sở tri
thức.
1.3.2 Suy diễn trong hệ chuyên gia:
Hai cơ chế suy diễn được sử dụng trong các hệ chuyên gia là Suy diễn tiến và
Suy diễn lùi:
1.3.2.1 Suy diễn tiến:
Khái niệm: Suy diễn tiến là chiến lược suy diễn bắt đầu bằng tập hợp các
Fact đã biết, tìm ra các Fact mới bằng cách sử dụng các luật có các giả thiết phù
hợp với Fact. Quá trình này cứ tiếp diễn cho đến khi đạt được một trạng thái đích
hoặc không còn luật nào có các giả thiết phù hợp với Fact để suy ra Fact mới.

Ưu điểm của chiến lược suy diễn tiến:
Hoạt động hiệu quả với các bài toán bắt đầu từ việc thu tập thông tin sau đó tìm
ra các thông tin nào có thể suy diễn từ thông tin ban đầu này.
20 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Máy
suy diễn
Cơ sở tri thức
Tri thức phán đoán
Tri thức thực hành
Biểu diễn tri thức và ứng dụng 2012
Cung cấp lượng thông tin khổng lồ từ một số ít thông tin ban đầu.
Nhược điểm của chiến lược suy diễn tiến:
Không có cách nào để nhận biết một sự kiện quan trọng hơn các sự kiện khác.
Hệ thống có thể mất rất nhiều thời gian vào các thông tin không cần thiết.
Hệ thống có thể đưa ra kết luận không quan hệ nhiều đến vấn đề người dùng quan

xử lý các sự kiện và các luật mờ, Logic mờ ra đời nhằm cung cấp các phương
pháp cho việc biểu diễn và suy diễn các thuật ngữ không rõ ràng. Các thuật ngữ
không rõ ràng được biểu diễn trong các tập mờ. Ví dụ:
Hình 6. Hệ thống mờ cho tốc độ
Nếu chiếc xe chạy với tốc độ 40 km/h thì:
Với tập trung bình thì mức độ tin tưởng MV (Membership Value) = 1
Với hai tập Cao và Thấp thì MV = 0.25
Biểu diễn tri thức trong hệ chuyên gia
Có rất nhiều phương pháp biểu diễn tri thức trong máy
 Dùng luật sản xuất, hệ chuyên gia dựa trên các luật
 Mạng ngữ nghĩa
 Ngôn ngữ nhân tạo
22 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
1
0.5
0
10 20 30 50 60
Tốc độ
Thấp
Trung bình Cao
Biểu diễn tri thức và ứng dụng 2012
 Bộ OAV(Object Attributes Values)
 Khung (Frame)
1.3.3 Biểu diễn tri thức trong các hệ chuyên gia
1.3.3.1 Logic mệnh đề:
Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán logic tác
động lên các ký hiệu để thể hiện suy luận lôgic. Logic mệnh đề nghiên cứu cách
xử lý các phát biểu.
Một mệnh đề mô tả một sự kiện, quan hệ giữa các đối tượng của thế giới thực

 Ngôn ngữ thông dịch
 Ngôn ngữ biên dịch
 Không có phép gán
 Hợp nhất
 Không có biến toàn cục
 Không có vòng lặp
 Đệ quy
 Không có cấu trúc điều kiện
 Quay lui
 Nghĩa khai báo
 Nghĩa thủ tục
1.4.3 Sự kiện và luật:
24 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Chương trình Prolog và tập hợp các sự kiện (event) và luật (rule) xử lí và mô
tả quan hệ giữa các đối tượng.
1.4.4 Sự kiện:
Một sự kiện là một khẳng định một thực thể có một hoặc một vài tính chất.
Quy ước:
P(A1, ,An).
P: là tên của tính chất
A1, ,An là các đối:
 Nguyên tử (Atom)
 Số (number)
 Biến (variable)
 Cấu trúc phức hợp (cây, danh sách, chuỗi )
1.4.5 Luật:
 Phần bên trái chỉ kết luận, được gọi là đầu (head) của luật.
 Phần bên phải chỉ điều kiện, được gọi là thân của luật. Nếu có nhiều điều


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status