Ứng dụng hệ chuyên gia trong xây dựng chương trình đọc văn bản tiếng việt có ngữ điệu - Pdf 37

MỤC LỤC
MỤC LỤC .........................................................................................3
MỞ ĐẦU............................................................................................4
Chương 1. TỔNG QUAN VỀ TEXT TO SPEECH ........................5
1.1 Lịch sử về tổng hợp tiếng nói.......................................................... 5
1.2 Cấu trúc âm thanh trong tiếng Việt............................................... 7
1.2.1 Các khái niệm....................................................................................7
1.2.2 Các đặc tính cơ bản của tiếng Việt...................................................7
1.2.3 Hệ thống ngữ âm tiếng Việt..............................................................8

1.3 Đặc trưng âm tố ............................................................................ 10
1.3.1 Ðặc trưng vật lí ...............................................................................10
1.3.2 Ðặc trưng sinh lí.............................................................................11
1.3.3 Ðặc trưng xã hội.............................................................................13

1.4 Các phương pháp tổng hợp tiếng nói........................................... 14
1.4.1 Phương pháp tổng hợp trực tiếp ....................................................15
1.4.2 Phương pháp tổng hợp Formant....................................................19
1.4.2 Các phương pháp tổng hợp khác ...................................................22

Chương 2. TỔNG QUAN VỀ HỆ CHUYÊN GIA ........................24
2.1 Các khái niệm về hệ chuyên gia ................................................... 24
2.2 Cấu trúc một hệ chuyên gia.......................................................... 25
2.2.1 Cơ sở tri thức ..................................................................................26
2.2.2 Bộ nhớ làm việc...............................................................................26
2.2.3 Mô tơ suy luận.................................................................................26
2.2.4 Phương tiện giải thích.....................................................................27
2.2.5 Giao diện .........................................................................................27

2.3 Xây dựng hệ chuyên gia................................................................ 28
2.4 Tri thức và cách thể hiện tri thức................................................. 30

sử phát triển chỉ khoảng 50 năm) được quan tâm nghiên cứu trên phạm vi toàn
thế giới. Một số nội dung chính của Công nghệ Ngôn ngữ: Dịch tự động ngôn
ngữ tự nhiên, Nhận dạng ký tự (chữ viết tay và chữ in), Nhận dạng và tổng hợp
tiếng nói (công nghệ tiếng nói), tìm kiếm văn bản toàn văn, Hiểu ngôn ngữ, khai
phá dữ liệu văn bản, tóm tắt nội dung văn bản...
Thời gian gần đây, có rất nhiều chương trình tổng hợp tiếng nói sử dụng
nhiều phương pháp khác nhau, với mục đích nghiên cứu, tìm hiểu nhằm nắm rõ
hơn về vấn đề này, tôi quyết định chọn đề tài: ”Ứng dụng hệ chuyên gia trong
xây dựng chương trình đọc văn bản tiếng Việt có ngữ điệu”. Đây là một đề tài
tương đối khó, bởi vì nó liên quan đến cả lĩnh vực Hệ chuyên gia và thu thập tri
thức.Tuy đã có cố gắng rất nhiều trong thời gian thực hiện, nhưng không sao
tránh khỏi sai sót, tôi rất mong có sự góp ý của của các thày cô và bạn bè.

4

Chương 1. TỔNG QUAN VỀ TEXT TO SPEECH

Tổng hợp giọng nói là việc tạo ra giọng nói của người từ đầu vào là văn bản
hay các mã hóa việc phát âm. Hệ thống thực hiện việc này còn gọi là máy tổng
hợp giọng nói, có thể là hệ thống phần mềm hoặc phần cứng. Hệ thống này còn
được gọi là văn bản-sang-tiếng nói (text-to-speech, TTS); tuy rằng không phải hệ
thống tổng hợp giọng nói nào cũng có đầu vào là văn bản (nhiều hệ thống thu
nhận mã hóa cách phát âm, ví dụ mã IPA, như đầu vào). Các hệ thống này có
nhiều ứng dụng. Ví dụ như hệ thống này có thể giúp người khiếm thị nghe được
máy đọc ra văn bản; đặc biệt là các văn bản có thể xử lý trên máy tính. Hệ thống
như vậy có thể lắp đặt trong phần mềm xử lý văn bản hay trình duyệt mạng.

1.1 Lịch sử về tổng hợp tiếng nói
Từ lâu trước khi kỹ thuật xử lý tín hiệu bằng thiết bị điện tử hiện đại ra đời,

Bell. Máy ghi âm và tổng hợp giọng nói của Kelly tạo ra bài hát Daisy Bell, với
âm nhạc phụ họa bởi Max Mathews. Vào lúc trình diễn, Arthur C. Clarke đang
thăm bạn và đồng nghiệp John Pierce ở khu thí nghiệm Bell ở Murray Hill.
Clarke đã bị ấn tượng mạnh bởi trình diễn của máy phát âm và đã dùng hình ảnh
này trong tiểu thuyết và kịch bản phim của ông 2001: A Space Odyssey, trong đó
máy tính HAL 9000 hát cùng bài hát khi nó sắp bị nhà du hành vũ trụ Dave
Bowman đặt vào trạng thái ngủ.
Công nghệ tổng hợp giọng nói đã tiến hóa nhanh kể từ đó. Hiện nay có
hàng trăm hệ thống tổng hợp giọng nói, thương mại cũng như tự do.
Tuy đã đạt được thành tựu trong tổng hợp giọng nói bằng kỹ thuật điện tử,
các nghiên cứu vẫn đang được tiến hành để tạo ra bộ tổng hợp giọng nói cơ học,
mô phỏng thanh quản của người, dùng trong robot dạng người. Các bộ tổng hợp
giọng nói điện tử bị giới hạn bởi chất lượng của loa, bộ phận cuối cùng tạo ra âm
thanh, dù tín hiệu điện tử có hoàn hảo. Có hy vọng rằng bộ thanh quản cơ khí có
thể tạo ra giọng nói chuẩn hơn loa thông thường.
Tại Việt Nam, công việc nghiên cứu xử lý tiếng nói tiếng Việt (hiện thời
trọng tâm là tổng hợp tiếng Việt) được bắt đầu tại Phòng Công nghệ Phần mềm
từ năm 1998 và đến nay đã xây dựng được hệ TTS tiếng Việt dựa trên tiếng nói
được tổng hợp bằng luật VNSPEECH. Thời kỳ đầu đã thử nghiệm phương pháp
Tổng hợp tiếng nói bằng ghép nối. Ý tưởng chính của phương pháp là ghi âm
chính tiếng nói con người và sau đó phát lại. Ưu điểm của phương pháp là ban
đầu dễ triển khai, tiếng nói tạo ra chính là tiếng người. Tuy nhiên, phương pháp

6

có hạn chế là dữ liệu lớn, chi phí tốn kém khi thêm giọng nói và các tham số đặc
trưng chỉ có thể điều khiển hạn chế. Từ năm 2000 bắt đầu chuyển sang phương
pháp Tổng hợp tiếng nói bằng luật dựa trên cơ sở tìm hiểu bản chất, các đặc
trưng của tiếng nói, và quy luật để tạo tiếng nói con người. Phương pháp tổng

7

cuộc nghiên cứu trên tiếng Việt đã chỉ ra một số bất đồng trong hệ thống chữ
viết, mặc dù vậy, nhìn chung tiếng Việt vẫn nhất quán giữa đọc và viết.
Hiện tượng môi hóa : trong tiếng Việt có một số âm môi như ô, u. Các phụ
âm đứng trước các âm này sẽ bị hiện tượng biến đổi sóng âm, gọi là hiện tượng
môi hóa. Ví dụ : trong các từ bu, tô thì phụ âm b, t sẽ phát âm khác đi so với
đứng trong các từ khác.

1.2.3 Hệ thống ngữ âm tiếng Việt
Thanh Điệu
Phần vần

Âm Đầu

Âm đệm

Âm chính

Âm cuối

Hình 1- 1. Cấu trúc âm tiết tiếng Việt

Một âm tiết tiếng Việt gồm 3 phần :
+ Thanh điệu : là yếu tố luôn có mặt trong mọi âm tiết tiếng Việt.
+ Âm đầu : yếu tố mở đầu âm tiết, thường độc lập với phần còn lại.
+ Phần vần : gồm 3 phần :
- Âm đệm : là một bán nguyên âm chiếm vị trí trung gian giữa phụ âm đầu

được.
Ví dụ: "gi", "gh", "ng", . không thể ghép lại bằng các âm của từng ký tự
riêng biệt mà phi phát âm một cách duy nhất.
+ Phụ âm làm phụ âm cuối phát âm hoàn toàn với lúc làm phụ âm đầu. Có 8
phụ âm vừa có thể làm phụ âm đầu vừa có thể làm phụ âm cuối là {c, ch, m, n,
ng, nh, p, t} và được chia ra làm 2 loại :
+ Loại vang (hữu thanh): m, n, nh, . khi các phụ âm này làm âm cuối thì
nguyên âm đứng trước nó phát âm bình thường, không bị nén hay ngắt lại
+ Loại tắc (vô thanh) : p, t, c. Khi các phụ âm này làm âm cuối thì nguyên
âm đứng trước nó phát âm bị nén hay ngắt lại.
b

c

ch

d

đ

g

gi

gh

h

k

tr

x

v

Hình 1- 2. Bảng phụ âm tiếng Việt
Nguyên âm :

9

Là thành phần không thể thiếu trong tiếng Việt. Nó được dùng làm âm
chính. Khi làm âm chính, nó kết hợp với các âm đệm và âm cuối (có thể không
có) tạo nên phần vần và làm đỉnh của âm tiết. Có hai loại là nguyên âm đơn và
nguyên âm đôi.

Nguyên âm đơn

Nguyên âm đôi

a

i

ư

ia

ă

thể và được truyền đi trong một môi trường truyền âm nhất định. Âm thanh của
lời nói, tương tự, là những sóng âm được tạo ra từ dao động của các bộ phận
trong bộ máy phát âm và được truyền đi trong môi trường truyền âm (thường là
không khí). Những sóng âm này truyền đến tai người nghe, đập vào màng nhĩ,
tạo ra rung động để người nghe nhận biết được lời nói. Chúng có đặc trưng được
xác định bởi các yếu tố sau đây:
+ Ðộ cao (hauteur /pitch): do tần số dao động của dây thanh và/hoặc
của các bộ phận khác trong bộ máy phát âm quyết định. Tần số dao động (số chu
kì dao động trong một giây) càng lớn thì âm thanh càng cao và ngược lại. Ðơn vị
để đo độ cao của âm thanh là Hertz (viết tắt là Hz). Tai người có thể nghe được
âm thanh có tần số dao động từ 16 đến 20.000 Hz. Âm vực dùng trong lời nói
hẹp hơn thế nhiều. Trong lời nói của một người, độ cao của âm thanh là yếu tố cơ
bản tạo nên thanh điệu, ngữ điệu và cả trọng âm.
+ Ðộ mạnh (intensité/intensity): do biên độ dao động của vật thể quyết
định. Biên độ dao động là trị số lớn nhất mà dao động đạt tới trong một nửa chu

10

kì. Biên độ dao động càng lớn, âm thanh càng vang to và ngược lại. Ðơn vị đo độ
mạnh của âm thanh là décibel (viết tắt là dB). Trong lời nói của một người, độ
mạnh của âm thanh là yếu tố cơ bản tạo nên âm lượng của âm và trọng âm của
từ.
+ Ðộ dài (durée/length): do thời gian dao động của vật thể quyết định.
Ðộ dài của âm thanh tạo nên sự tương phản giữa các bộ phận của lời nói, là yếu
tố tạo nên trọng âm, tạo nên các nguyên âm đối lập nhau về độ dài. Hai từ "tang"
và "tăng" trong tiếng Việt có sự đối lập âm a dài (trong "tang") và âm a ngắn
(trong "tăng").
+ Âm sắc (timbre): phụ thuộc vào độ cao, độ dài và độ mạnh tham gia
bổ sung vào các thành phần kết cấu của âm. Ðây là vẻ riêng biệt của một âm. Âm

phổi được đẩy qua khí quản, vào thanh hầu rồi thoát qua các cộng minh trường
phía trên thanh hầu để thoát ra ngoài. Có thể thấy hai trường hợp. Trường hợp 1,
không khí thoát ra làm rung dây thanh với một tần số nào đó đểï tạo nên một âm
với một thanh điệu nhất định. Âm này nhỏ, được uốn nắn, được khuếch đại nhờ
các cộng minh trường (thanh hầu, khoang hầu, khoang miệng, khoang mũi) để
trở thành âm thanh lời nói. Trong trường hợp này, ta sẽ có các âm hữu thanh
(sons sonores/voiced sounds). Nếu dây thanh có chu kì rung đều đặn, ta sẽ có
âm chứa nhiều tiếng thanh. Ngôn ngữ học gọi các âm loại này là các âm vang.
Các nguyên âm và các phụ âm mũi, phụ âm bên, phụ âm rung là các âm vang.
Trường hợp nói thì thào, không khí từ phổi ra tuy mạnh nhưng dây thanh ở xa
nhau và chỉ rung động rất nhẹ; ngôn ngữ học gọi các âm thì thào là các âm giọng
thở (sons soufflés/breathed sounds).
Trường hợp hai, không khí thoát ra không làm rung dây thanh thì lượng khí
sẽ cọ xát, lách qua hoặc phá vỡ chỗ cản được tạo ra bởi các bộ phận hoạt động
được của bộ máy phát âm để tạo ra âm, rồi được khoang hầu, khoang miệng,
khoang mũi cộng hưởng, khuếch đại thành âm thanh lời nói. Ngoài cộng minh
trường là thanh hầu chứa dây thanh, các cộng minh trường còn lại có tác dụng
khống chế một số tần số này và tăng cường một số tần số khác tạo nên các hòa
âm. Việc không khí cọ xát hoặc bật phá chỗ cản sẽ tạo nên những dao động có
chu kì không đều đặn làm thành những tiếng động (tiếng ồn). Những âm có tiếng
động, không có sự tham gia của tiếng thanh được gọi là các âm vô thanh (sons
sourds/ voiceless sounds).
Tóm lại, để phát âm, bắt buộc phải có không khí được đẩy ra, tạo năng
lượng phát âm; phải có hoạt động cấu âm của các cơ quan trong bộ máy phát âm.
Khi phát âm, nói chung luồng hơi được đẩy ra từ phổi. Tuy nhiên, ở một số ít
ngôn ngữ, có những âm thanh được phát ra từ khoang hầu hoặc từ mạc. Khi
luồng hơi được phát ra từ khoang hầu, thanh hầu từ vị trí bình thường nhấc lên
cao hơn hoặc hạ xuống thấp hơn và có tác dụng tạo âm; luồng hơi cũng có thể

12

"tờ" và "đờ" chỉ là hai cách phát âm khác nhau của cùng một âm vị. Dù có nói
"đại đoàn kết" hay "tại toàn kết" thì cũng chỉ có một nội dung biểu đạt.
Về đặc điểm cấu âm - âm học của từng âm vị, do mỗi dân tộc khi phát âm
tiếng nước mình, có thói quen sử dụng bộ máy phát âm riêng, thêm nữa, cấu tạo
sinh lí của bộ máy phát âm cũng có nét riêng, nên về nguyên tắc, rất hiếm khi

13

một âm vị của ngôn ngữ này có đặc trưng cấu âm - âm học giống hệt với một âm
vị nào đó của một ngôn ngữ khác.

1.4 Các phương pháp tổng hợp tiếng nói
Phần này tôi xin trình bày một cách vắn tắt về những phương pháp tổng
hợp tiếng nói, mà hiện nay đang phổ biến và dược nghiên cứu rộng rãi. Chi tiết
phương pháp tổng hợp mà tôi áp dụng trong đợt nghiên cứu này sẽ được trình
bày ở phần sau.
Ta có thể dây dựng được một mô hình đơn giản, của quá trình tổng hợp
tiếng nói như sau:

Văn bản, quá
trình xử lý
tiếng nói khác

Tạo tham
số

Bộ tổng
hợp

chế với các yêu cầu vừa và nhỏ, đồng thời việc tạo dữ liệu khá mất thời gian và
công sức, đòi hỏi kỹ thuật cao.
Sơ đồ khối các bước trong phương pháp tổng hợp tiếng nói trực tiếp được
mô tả như sau:

Từ điển

Các đơn vị tiếng
nói được lưu trữ
Chuỗi mã đơn
vị tiếng nói

Văn bản
Khối truy
nhập từ vựng

Tiếng nói
Khối ghép
nối

Hình 1-5. Các bước trong phương pháp tổng hợp trực tiếp

a. Ghép từng từ đơn
Tính chất tiếng Việt là âm của từ đầu không ảnh hưởng âm các từ sau. Do
đó ta có thể ghép các từ thành một câu. Phương pháp này đạt độ tự nhiên cao
nhất và cách hiện thực đơn giản nhất.
Tiếng Việt phổ thông có khoảng 6000 từ. Nếu ta thu với tần số lấy mẫu
8KHz, 8 bit/mẫu, mono, nén PCM. Mỗi từ thu trong 0.8 giây (tốc độ đọc chậm
nhất) thì khối lượng âm thanh cần lưu trữ là:
6000 * 8000 * 1 * (1/2) * 0.8 = 19,200,000 bytes.

Một từ được tách ra làm hai phần là phụ âm đầu và vần. điều này căn cứ
trên đặc điểm tiếng Việt là phụ âm đầu ít phụ thuộc vào phần vần và thanh điệu.
Trong phụ âm đầu được cắt rất ngắn chỉ còn lại âm bật (thông thường vào
khoảng 0.15 giây). Phần vần cũng được cắt bỏ ở phần đầu một lượng tưng ứng.
Phương pháp này cho chất lượng âm thanh tương đương so với phương
pháp ghép từ đơn. Theo phương pháp này ta tách được 28 phụ âm đầu và 650
phần vần. Với cách thu âm như trước thì khối lượng lưu trữ sẽ là:
650*8000*1* (1/2)* (0.8 - 0.15)+28*8000*1*(1/2)*0.15=1,706,800~1.7 Mbytes.

16

Hình 1-6. Mô tả cách ghép hai âm thành từ

17

Nhận xét:
Một từ tiếng việt bao gồm 2 phần: phần âm đầu và phần vần. Âm đầu chủ
yếu là các phụ âm trong tiếng việt. Qua nghiên cứu và tìm hiểu thêm, chúng em
thấy rằng:
+ Ứng với một loại âm đầu (ở đây chủ yếu là phụ âm ) phần vần ở phía sau
sẽ thay đổi theo một quy luật nào đó so với phần vần chuẩn khi chưa có âm đầu
tuỳ theo cách phát âm của phụ âm. Chẳng hạn :
/t/
/ch/

/am/ t
/am/ ch

để có thể đánh giá ưu điểm về chất lượng so với phương pháp loại một.

1.4.2 Phương pháp tổng hợp Formant
Đây là phương pháp tổng hợp được dùng rộng rãi nhất trong những năm
gần đây, nó dựa trên mô hình lọc số tiếng nói. Phương pháp này có hai cấu trúc
cơ bản, đó là cấu trúc song song và cấu trúc nối tiếp. Tuy vậy vì lý do thời gian
và sự phức tạp của phương pháp, nên chúng ta chỉ có thể tìm hiểu qua một vài
đặc điểm của phương pháp tổng hợp tiếng nói này. Mô hình tổng quát của
phương pháp này như sau:

Hình 1- 7. Mô hình tổng hợp âm tiết tiếng Việt

Phương pháp tổng hợp Formant có hai cấu trúc cơ bản, đó là cấu trúc song
song và nối tiếp. Đã có rất nhiều tranh cãi về chất lượng và điểm hợp lý của hai
cấu trúc này. Ta dễ thấy kết quả tốt chỉ với một phương pháp là khó đạt được, vì
thế người ta cố gắng cải thiện và tổ hợp các phương pháp cơ bản này. Năm 1984
Denis Klatt đã đề ra một bộ tổng hợp Formant phức tạp hơn, được kết hợp cả hai
bộ tổng hợp nối tiếp và song song, với việc thêm các bộ cộng hưởng và phản

19

cộng hưởng cho các âm mũi hoá, sau Formant cho nhiều tần số cao, một đường
rẽ để đưa ra hàm truyền đạt phẳng, và các đặc điểm phát âm. Hệ thống được
dùng có mô hình nguồn kích hoạt hoàn toàn phức tạp, điều khiển bởi 39 tham số
được cập nhật mỗi 5 mili giây. Chất lượng của bộ tổng hợp Formant của Klatt đã
được cải thiện nhiều và được áp dụng vào một số hệ thống TTS (Text To Speech)
hiện nay như MITalk, DECTalk, Prose-2000 và Klattalk.
Sau đây là hai mô hình của bộ tổng hợp Formant được nghiên cứu và áp
dụng nhiều trong thực tiễn nhất:

A2

Formant1
F2

BW2

Nguồn kích

Tiếng nói
X
A3

X

Formant2
F3

+

BW3

Formant3

Hình 1- 9. Cấu trúc cơ bản của bộ tổng hợp Formant song song

20

Tổng hợp Formant dựa trên một tập các luật được dùng đổ xác định các

cứu ban đầu đã được thực hiện. Theo sau các vụ chuyển nhượng các từng phần
của NeXT (bắt đầu từ Steve Jobs vào cuối những năm 1980 và việc hợp nhất với
Apple năm 1997), phần mềm của Trillium được phân phát với giấy phéo tự do
GPL. Dự án gnuspeech, một dự án của GNU, tiếp tục phát triển phần mềm này.
Phần mềm gốc NeXT và các chuyển đổi sang cho Mac OS/X và GNUstep trong
GNU/Linux có thể tìm thấy tại trang GNU savannah; chúng đều kèm theo tài liệu
hướng dẫn trực tuyến và các bài viết liên quan đến lý thuyết nền tảng của công
trình. Hệ thống, vốn được thương mại hóa lần đầu vào năm 1994, tạo ra một máy
tổng hợp giọng nói dựa trên mô phỏng phát âm hoàn chỉnh, dựa trên mô hình ống
dẫn sóng tương đương với cơ quan phát âm của người. Nó được điều khiển bởi
Mô hình Phần Riêng biệt của Carré; bản thân mô hình này lại dựa trên công trình
của Gunnar Fant và các người khác ở Phòng thí nghiệm Công nghệ Giọng nói
Stockholm thuộc Viện Cộng nghệ Hoàng gia Thụy Điển về tổng hợp giọng nói

22

cộng hưởng tần số. Công trình này cho thấy các cộng hưởng tần số trong ống
cộng hưởng có thể được điều khiển bằng cách thay đổi tám tham số tương đồng
với các cách phát âm tự nhiên của cơ quan phát âm của người. Hệ thống bao gồm
một từ điển phát âm cùng với các quy tắc phát âm tùy thuộc ngữ cảnh để giúp
ghép nối âm điệu và tạo ra các tham số phát âm; mô phỏng theo nhịp điệu và ngữ
điệu thu được từ các kết quả nghiên cứu ngữ âm học.

b. Tổng hợp lai
Các hệ thống tổng hợp lai kết hợp các yếu tố của tổng hợp cộng hưởng tần
số với tổng hợp ghép nối để giảm thiểu các tiếng cọ xát khi ghép nối các đoạn âm
thanh.
Một ví dụ là RecSimCat, phát triển bởi Shakti Singh Parmar có thể tạo ra
giọng dễ nghe và tự nhiên.

thống nằm ở cấu trúc. Trong các chương trình truyền thống, cách thức xử lý hay
hành vi của chương trình đã được ấn định sẵn qua các dòng lệnh của chương
trình dựa trên một thuật giải đã định sẵn. Trong các hệ CSTT, có hai chức năng
tách biệt nhau, trường hợp đơn giản có hai khối: khối tri thức hay còn được gọi là
cơ sở tri thức, và khối điều khiển hay còn được gọi là mô tơ suy luận. Với các hệ
thống phức tạp, bản thân mô tơ suy luận cũng có thể là một hệ CSTT chứa các
siêu tri thức (tri thức về cách sử dụng tri thức khác).
Việc tách biệt giữa tri thức khỏi các cơ chế điều khiển giúp ta dễ dàng thêm
vào các tri thức mới trong tiến trình phát triển một chương trình. Đây là điểm
tương tự của mô tơ suy luận trong một hệ CSTT và não bộ con người (điều khiển

24

xử lý), là không đổi cho dù hành vi của cá nhân có thay đổi theo kinh nghiệm và
kiến thức mới nhận được.
Giả sử một chuyên gia dùng các chương trình truyền thống để hỗ trợ công
việc hàng ngày, sự thay đổi hành vi của chương trình yêu cầu họ phải biết cách
cài đặt chương trình. Nói cách khác, chuyên gia phải là một lập trình viên chuyên
nghiệp. Hạn chế này được giải quyết khi các chuyên gia tiếp cận sử dụng các hệ
CSTT. Trong các hệ CSTT, tri thức được biểu diễn tường minh chứ không nằm ở
dạng ẩn như trong các chương trình truyền thống. Do vậy có thể thay đổi các
CSTT, sau đó các mô tơ suy luận sẽ làm việc trên các tri thức mới được cập nhật
nhằm thực hiện yêu cầu mới của chuyên gia.

2.2 Cấu trúc một hệ chuyên gia
Trong lĩnh vực hệ chuyên gia, các chuyên gia chú trọng vào tri thức của vấn
đề. Loại tri thức này được gọi là tri thức lĩnh vực, được chuyên gia lưu trữ trong
bộ nhớ vĩnh cửu.
Lúc cho lời khuyên, chuyên gia cần thu thập các sự kiện về lĩnh vực, lưu nó

2.2.2 Bộ nhớ làm việc
Bộ nhớ làm việc chứa các sự kiện liên quan đến vấn đề đang xét. Nó tương
ứng với bộ nhớ tạm thời trong mô hình giải vấn đề của con người. Nó là một
phần trong hệ chuyên gia chứa các sự kiện của vấn đề đang được xét.
Khi trao đổi với hệ chuyên gia, người dùng nhập thông tin về vấn đề hiện
tại vào bộ nhớ làm việc. Hệ thống khớp thông tin này với tri thức trong CSTT để
suy luận ra sự kiện mới. Hệ thống lại nhập sự kiện mới này vào bộ nhớ làm việc
và tiếp tục quá trình. Vậy bộ nhớ làm việc sẽ có các thông tin do người dùng đưa
vào và các thông tin do máy suy luận ra. Các thông tin này thường được gọi là
ngữ cảnh của phiên làm việc.
Nhiều ứng dụng hệ chuyên gia có thể lấy các thông tin từ bộ nhớ ngoài như
cơ sở dữ liệu, bảng tính…Chúng được tải vào bộ nhớ làm việc trước phiên làm
việc. Quá trình suy luận có thể chỉ dùng các thông tin này hoặc dùng các thông
tin này như thông tin bổ sung.

2.2.3 Mô tơ suy luận
Hệ chuyên gia mô hình hoá quá trình lập luận của con người trong khối mô
tơ suy luận. Mô tơ suy luận là quá trình trong hệ chuyên gia cho phép khớp các
sự kiện trong bộ nhớ làm việc với các tri thức về lĩnh vự trong CSTT để rút ra
các kết luận về vấn đề.
Mô tơ suy luận làm việc trên các sự kiện trong bộ nhớ làm việc và tri thức
lĩnh vực trong CSTT để rút ra thông tin mới. Vậy nó cần tìm ra các luật để khớp
phần giả thiết của luật với thông tin có trong bộ nhớ. Khi phát hiện thấy khớp, kết
luận của luật này là thông tin mới.

26

2.2.4 Phương tiện giải thích

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Ứng dụng hệ chuyên gia trong xây dựng chương trình đọc văn bản tiếng việt có ngữ điệu - Pdf 37

Tài liệu, ebook tham khảo khác

Học thêm