(Luận án tiến sĩ) Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực - Pdf 53

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGUYỄN THU ANH

Tên đề tài : Nghiên cứu tính giải nghĩa được của hệ mờ
theo ngữ nghĩa thế giới thực

LUẬN ÁN TIẾN SĨ TOÁN HỌC
Chuyên ngành: Cơ sở toán học cho tin học
Mã số: 62.46.01.10

Người hướng dẫn khoa học:
TS. Trần Thái Sơn

Hà Nội – 2019


LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các kết quả
được viết chung với các tác giả khác đều được sự đồng ý của đồng tác giả trước
khi đưa vào luận án. Các kết quả trong luận án là trung thực và chưa từng được
công bố trong bất kỳ công trình nào khác.

Tác giả

Nguyễn Thu Anh

1



2) Phép kết nhập ............................................................................................... 20
3) Phép kéo theo mờ .........................................................................................21
4) Phép hợp thành các quan hệ mờ ..................................................................22
I.2. Biến ngôn ngữ ....................................................................................................23
I.3. Phân hoạch mờ ...................................................................................................24
I.4. Mô hình mờ ........................................................................................................25
I.5. Hệ dựa trên luật mờ (Hệ mờ) .............................................................................26
1) Các thành phần của hệ mờ .............................................................................26
2) Các mục tiêu khi xây dựng FRBS ...................................................................27
3) Ứng dụng của hệ mờ ......................................................................................29
I.6. Đại số gia tử. .......................................................................................................32
1) Khái niệm Đại số gia tử .................................................................................32
2) Một số tính chất của Đại số gia tử tuyến tính ................................................33
3) Độ đo tính mờ của các giá trị ngôn ngữ ........................................................34
4) Khoảng tính mờ .............................................................................................. 37
5) Định lượng ngữ nghĩa của giá trị ngôn ngữ ..................................................38
I.7. Kết luận chương 1 .............................................................................................. 40
CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN THỨC NGÔN
NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ.............................................................. 41
II.1.Mở đầu ................................................................................................................41
II.2.Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ ........................................44
II.2.1.Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán
khung nhận thức ngôn ngữ .................................................................................47

3


II.2.2.Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa của
các từ của biến ....................................................................................................50
II.2.3.Bổ sung ràng buộc trên biểu diễn tính toán của các khung NTNN ..........55


4


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Các ký hiệu:
AX

Đại số gia tử tuyến tính

AX *

Đại số gia tử tuyến tính đầy đủ

(h)

Độ đo tính mờ của gia tử h

fm(x)

Độ đo tính mờ của hạng từ x
Hàm định lượng của giá trị ngôn ngữ của biến

A(x)

Hàm xác định độ thuộc của giá trị x vào tập mờ A

l(x)

Độ dài của từ ngôn ngữ x


Giải nghĩa tập mờ của từ

ℐtrp

Ngữ nghĩa bộ ba của từ

CS

Không gian tính toán

CSw

Không gian tính toán thích hợp với thế giới thực W

Sw

Cấu trúc của thế giới thực con W

Các từ viết tắt:
DB

Database

ĐSGT

Đại số gia tử

FoC



Liguistic Frame of Cognitive

MF

Membership Function

SQM

Semantically Quantifying Mapping

RWS

Real World Semantics

LE

Liguistic Expression

CE

Computational Expression

FSyst

Fuzzy System

ARM

Approximate Reasoning Method

Hình 3.4. Hợp của 2 tập mờ của biến CHIỀU_CAO .................................. 92

7


Hình 3.5. Biểu diễn tính toán của các luật r1 và r15 của LRB ℛℬ được đưa ra
trong Bảng 3.1 .............................................................................................. 95
Hình 3.6. Biểu diễn đồ thị số của LRB đi qua 9 điểm .............................. 102

Bảng biểu
Bảng 3.1. FRB đơn giản cho bộ truyền động tầng thứ nhất ....................... 94

8


MỞ ĐẦU
Trong những thập niên gần đây khoa học và công nghệ phát triển rất
mạnh mẽ, đã sản sinh ra nhiều thiết bị máy móc hỗ trợ cho con người trong
mọi lĩnh vực của sống. Trong một số lĩnh vực, chúng ta mong muốn máy
móc có thể mô phỏng được hành vi, khả năng lập luận như con người và đưa
ra cho con người những gợi ý tin cậy trong quá trình ra quyết định. Một đặc
trưng nổi bật của con người là khả năng suy luận trên cơ sở tri thức được
hình thành từ cuộc sống và biểu thị bằng ngôn ngữ tự nhiên. Do đó máy móc
muốn hành xử như con người thì nó phải được trang bị cơ sở tri thức và khả
năng lập luận trên ngôn ngữ. Đây là một bài toán rất phức tạp, vì vậy để giải
quyết yêu cầu này các nhà khoa học đã và đang nghiên cứu cả về lý thuyết
lẫn ứng dụng với mục đích đưa ra các phương pháp nhằm mô phỏng khả
năng lập luận của con người trên các thiết bị máy móc. Do đặc trưng của
ngôn ngữ là tính mờ, vì vậy bài toán đầu tiên cần phải giải quyết đó là làm
thế nào để hình thức hóa toán học các vấn đề ngữ nghĩa ngôn ngữ và xử lý

kinh tế, ngôn ngữ học [19]. Trong những lĩnh vực này các FRBS được xem
như là các hộp xám (gray-boxes). Và ở đây đặt ra yêu cầu là các FRBS khi
được ứng dụng thì người dùng có thể kiểm tra và hiểu được tất cả các thành
phần của nó [24]. Vì vậy, trong những năm gần đây vấn đề tính giải nghĩa
được của FRBS trở thành một chủ đề “nóng” được nhiều nhà khoa học tập
trung nghiên cứu. Ví dụ như Alonso và cộng sự [24], Antonelli và các cộng
sự [16], Cordon [17], Gacto và cộng sự [18], Ishibuchi và Nojima [34],
Mencar và các cộng sự [28] [19], Nauck [42], de Oliveira [48], Pulkkinen và.
Koivisto [21], Zhou và Gan [29].
Mục tiêu độ chính xác của FRBS đã có định nghĩa bằng công thức toán
học để đánh giá như thế nào là một FRBS tốt. Với bài toán phân lớp, độ
chính xác được đo bằng tỉ lệ phần trăm giữa số mẫu dữ liệu được phân lớp
chính xác trên số mẫu dữ liệu được kiểm tra, tỉ lệ này càng cao càng tốt. Với
bài toán hồi quy độ chính xác được đo bằng giá trị trung bình phương sai
(Mean Square Error viết tắt là MSE) giữa giá trị đầu ra được lập luận bằng
FRBS với giá trị đầu ra cho trước của mẫu dữ liệu, giá trị này càng nhỏ càng
tốt.
Về tính giải nghĩa được của FRBS, trong [19] Mencar cho rằng “Tính
giải nghĩa được là vấn đề chính khi thiết kế các hệ thống dựa trên tính toán
với từ (Computing With Word - CWW), thiếu tính giải nghĩa được sẽ làm
thiệt hại đến những lợi ích của CWW. Nếu FRBS không có tính giải nghĩa
được thì thay thế bằng các phương pháp thuần số học sẽ mang lại hiệu quả
cao hơn”. Do đó những năm gần đây mục tiêu tính giải nghĩa được được các

10


nhà nghiên cứu quan tâm nhiều hơn khi thiết kế FRBS. Tính giải nghĩa được
không phải là một tính chất, nó liên quan đến nhiều yếu tố khác nhau. Hiện
tại chúng ta vẫn chưa có một tiêu chuẩn toán học để mô tả chính xác khái

từ và từ nối giữa chúng không được định nghĩa bằng một phương pháp hình
11


thức đầy đủ dựa trên ngữ nghĩa vốn có của từ. Vì thế, có thể phải tìm kiếm
một hướng tiếp cận mới cho vấn đề này mà ở đó ngữ nghĩa tính toán của từ
được định nghĩa bằng một phương pháp hình thức đầy đủ dựa trên ngữ nghĩa
vốn có của từ.
Năm 2017, một cách tiếp cận mới đối với khả năng giải nghĩa được của
hệ mờ, đó là cách tiếp cận dựa trên tính giải nghĩa theo ngữ nghĩa thế giới
thực (Real-world-semantics-based approach – RWS- approach) lần đầu tiên
đã được đề xuất và bước đầu được khảo sát trong [5] bởi N.C. Hồ và cộng
sự. Cách tiếp cận này dựa trên các ngữ nghĩa mang tính chất thế giới thực
của các từ và các mối quan hệ giữa ngữ nghĩa của các thành phần hệ mờ với
các cấu trúc phần tương ứng trong thế giới thực.
Cụ thể, cách tiếp cận theo ngữ nghĩa thế giới thực đề cập đến mối quan
hệ giữa ba thực thể: (1) một hệ thống mờ, được coi là một biểu thức hình
thức; (2) mô hình của nó, đó là hình ảnh tính toán của biểu thức hình thức và
(3) cấu trúc thế giới thực của nó. Tính giải nghĩa theo ngữ nghĩa thế giới
thực của biểu thức tính toán biểu diễn một thành phần hệ thống mờ được
đảm bảo bởi các ràng buộc được đề xuất từ hiện thực tương ứng của nó.
Cách tiếp cận ngữ nghĩa thế giới thực thiết lập một cơ sở hình thức để thu
hẹp khoảng cách giữa ngữ nghĩa tính toán của một hệ thống được thiết kế
bởi người thiết kế và ngữ nghĩa thực sự của tất cả các thành phần hệ thống,
bao gồm khung nhận thức ngôn ngữ (LFoCs), cơ sở luật ngôn ngữ (FRBs) và
phương pháp lập luận xấp xỉ (ARM), được xác định trong ngữ cảnh thế giới
thực mà nó liên quan. Vì ngữ nghĩa của bất kỳ biểu thức hoặc lý thuyết hình
thức nào (kể cả lý thuyết toán học) phải được định nghĩa trong quan hệ chặt
chẽ với thực tế liên quan, luôn có khoảng cách mà người phát triển phải vượt
qua để đảm bảo theo rằng lý thuyết được mô hình hoá phù hợp với phần

định nghĩa dựa trên độ phức tạp. Chẳng hạn như yêu cầu giới hạn số tập mờ
có thể sử dụng T trên mỗi biến không quá 72 [63], hoặc số tập mờ sử dụng
trong tất cả các biến ngôn ngữ phải tương đương nhau, hoặc số luật tối đa
trong các RB không quá lớn. Giới hạn này không phù hợp vì trong thực tế
khi con người hình thành các luật ngôn ngữ họ có thể lựa chọn bất kỳ từ nào
trong ngôn ngữ của họ mà nó phù hợp với luật cần xây dựng, và số các luật
trong miền tri thức của họ nhìn chung là lớn.
Để khắc phục phần nào những hạn chế của hướng tiếp cận dựa trên lý
thuyết tập mờ, Nguyen và Wechler đã đề xuất một hướng tiếp cận đại số
được gọi là Đại số gia tử (ĐSGT) cho vấn đề ngữ nghĩa tính toán của các từ
ngôn ngữ [58] [56]. Trong [58] [43] [35] Nguyen và cộng sự chỉ ra rằng, ngữ
nghĩa tính toán của từ phải được định nghĩa dựa trên ngữ nghĩa thứ tự vốn có

13


của các từ của biến, và các miền từ của các biến thiết lập một cấu trúc dựa
trên thứ tự là đủ giầu để giải các bài toán thực tế. Phương pháp luận ở đây là
mỗi miền từ trở thành một cấu trúc toán học. Việc gán ngữ nghĩa tính toán
cho các từ của một biến bằng các tập mờ được xem như là một ánh xạ. Về
nguyên tắc, nó phải là một đẳng cấu từ miền từ với cấu trúc tính toán yếu
vào một cấu trúc tính toán đủ giầu [35] và phải bảo toàn những tính chất
quan trong và cần thiết của từ, chẳng hạn như cấu trúc thứ tự, tính khái quát
và tính đặc tả.
Đại số gia tử hình thành một phương pháp tiếp cận đại số đối với ngữ
nghĩa vốn có của các từ của một biến ngôn ngữ. Nó thiết lập một phương
pháp hình thức đầy đủ và đúng đắn để liên kết ngữ nghĩa định lượng (ngữ
nghĩa tính toán) của các từ bao gồm cả ngữ nghĩa dựa trên tập mờ với ngữ
nghĩa vốn có của từ ngôn ngữ. Với phương pháp tiếp cận này, chúng ta chỉ
cần một bộ độ đo tính mờ của các từ của một biến đủ để xác định những đặc

làm việc với từ. Các FRBS thỏa mãn các ràng buộc này sẽ có tính giải nghĩa
cao hơn do ngữ nghĩa của các từ sử dụng trong FRBS được xây dựng trên cơ
sở ngữ nghĩa tự nhiên vốn có của nó.
Với mong muốn được tiếp tục các nghiên cứu về vấn đề giải nghĩa được
của FRBSs theo cách tiếp cận ngữ nghĩa thế giới thực, cũng như áp dụng đại
số gia tử để giải bài toán về tính giải nghĩa được, Luận án đặt ra mục tiêu là
tập trung vào thực hiện các nội dung sau:
- Nghiên cứu vấn đề tính giải nghĩa được của FRBS theo hướng tiếp
cận dựa trên ĐSGT và đề xuất thêm một số ràng buộc, định nghĩa, định lý
theo hướng tiếp cận này.
- Nghiên cứu cách tiếp cận dựa trên khả năng giải nghĩa theo thế giới
thực đối với vấn đề tính giải nghĩa được của hệ mờ. Trong luận án này,
chúng tôi sẽ phân tích sâu và thiết thực hơn về tính giải nghĩa của các lý
thuyết hình thức bao gồm các ngôn ngữ tự nhiên của con người nói chung và
các hệ mờ được hình thức hoá nói riêng.
Theo mục tiêu đặt ra ở trên, Luận án đã đạt được một số kết quả chính
có thể khái quát như sau:

Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối
quan hệ giữa ngữ nghĩa thế giới thực của các biểu thức ngôn ngữ và ngữ
nghĩa tính toán của biểu thức tính toán gán cho biểu thức ngôn ngữ. Trên cơ
sở ý tưởng này, đề xuất lược đồ giải bài toán tính giải nghĩa được của biểu
diễn tính toán của các khung nhận thức ngôn ngữ (khung NTNN), trong đó
khâu phát hiện ngữ nghĩa cấu trúc của khung NTNN có ý nghĩa quan trọng.

15



Thay cho việc đưa ra các ràng buộc đối với tập mờ được thiết kế

thuyết tập mờ như: tập mờ, phương pháp xây dựng tập mờ, biến ngôn ngữ,
phân hoạch mờ. Trình bày những nội dung cơ bản của lý thuyết ĐSGT như:
khái niệm ĐSGT, ĐSGT tuyến tính, ĐSGT tuyến tính đầy đủ, độ đo tính mờ,
hàm định lượng ngữ nghĩa (SQM), hệ khoảng tương tự. Trình bày tóm tắt về
hệ mờ, ứng dụng của hệ mờ và tính giải nghĩa được của nó.

16


Chương 2 bàn luận về vấn đề tính giải nghĩa được của Khung nhận thức
ngôn ngữ, trình bày khái niệm khung nhận thức, và phát biểu định nghĩa
khung nhận thức ngôn ngữ (LFoC). Trình bày hướng tiếp cận giải quyết vấn
đề tính giải nghĩa được của FRBS dựa trên ĐSGT, các ràng buộc trên khung
nhận thức ngôn ngữ, như ràng buộc ngữ nghĩa của từ, ràng buộc phương
pháp xác định ngữ nghĩa tính toán của từ, ràng buộc trên ngữ nghĩa khoảng
của từ và ràng buộc ngữ nghĩa thứ tự của từ. Cũng trong chương này, LA đề
xuất thêm các ràng buộc như ràng buộc về lõi ngữ nghĩa, ràng buộc về ngữ
nghĩa khoảng và khoảng lõi, ràng buộc về ngữ nghĩa tập mờ của từ, phương
pháp thiết kế ngữ nghĩa tính toán dạng cấu trúc đa thể hạt cho từ ngôn ngữ
của LFoC, thỏa mãn những ràng buộc đã được đề xuất. Phát biểu và chứng
minh các định lý về tính đúng đắn và sự thỏa mãn các ràng buộc mới.
Chương 3 thảo luận chi tiết hơn về vấn đề tính giải nghĩa được theo thế
giới thực của các hệ thống mờ, làm rõ thêm sự giải nghĩa RWS của các
ngôn ngữ tự nhiên của con người và các miền từ của các biến và vai trò cơ
bản của nó trong việc kiểm tra khả năng giải nghĩa RWS của các thành phần
của hệ thống mờ. Kiểm tra khả năng giải nghĩa của RWS về các hoạt động
cơ bản của lý thuyết tập mờ được định hướng lần đầu tiên để trả lời cho câu
hỏi liệu lý thuyết này có phải là giải nghĩa được RWS hay không. Đề xuất
một khả năng giải quyết sự giải nghĩa RWS của một số phương pháp lý luận
xấp xỉ dựa trên lý thuyết đại số gia tử và lý thuyết định lượng của chúng.

các tham số của hàm thuộc tương ứng.

18


Có nhiều dạng hàm thuộc để biểu diễn cho tập mờ A, mà trong đó dạng
hình thang, hình tam giác và hình chuông là thông dụng nhất. Sau đây là một
ví dụ về hàm thuộc được cho ở dạng hình thang.
Ví dụ 1.1. Cho A là một tập mờ, A có thể được biểu diễn dưới dạng
hình thang với hàm thuộc liên tục A(x) như sau:
0, x  a

x  a


, a  x  b
b

a




 A ( x; a, b, c, d )  1, b  x  c
,
d  x


, c  x  d
d  c

Trong điều khiển kỹ thuật, các dữ liệu vào và ra thường là các giá trị số.
Giá trị đầu vào được mờ hoá bằng các hàm đặc trưng. Giá trị đầu ra được

19


khử mờ dựa trên hàm đặc trưng đó. Có nhiều phương pháp để khử mờ, ở đây
chúng tôi chỉ đề cập đến phương pháp khử mờ trong [52] của R.Yager.
Giả sử A là một tập mờ trên vũ trụ U gắn với hàm thuộc , khi đó ta có
công thức khử mờ theo tham số  như sau:
n

x* 

 x (x ) 
i 1
n

i

i

 (x )



,   0,  

i


Lưu ý rằng khi chọn phương pháp khử mờ chúng ta cần quan tâm đến
phương pháp mờ hoá ban đầu.
2) Phép kết nhập
Trong lập luận mờ đa điều kiện, phép kết nhập thường được dùng để
tích hợp các điều kiện thành một đầu vào duy nhất để dễ dàng tính các quan
hệ mờ. Không có toán tử kết nhập phù hợp cho tất cả các bài toán nên khi
chọn toán tử kết nhập chúng ta cần thử nghiệm trong các trường hợp cụ thể.
Dựa vào các tính chất của các toán tử người ta chia thành các dạng như: tchuẩn (t-norm), t-đối chuẩn (t-conorm) và toán tử trung bình (averaging
operator).
Một toán tử kết nhập n chiều Agg: [0,1]n → [0,1] thông thường thỏa các
tính chất sau đây:
i) Agg(x) = x,
ii) Agg(0, …, 0) = 0; Agg(1, …, 1) = 1;
iii) Agg(x1, x2,…, xn)  Agg(y1, y2,…, yn) nếu (x1, x2,…, xn)  (y1, y2,…,
yn).
20


Lớp toán tử trung bình trọng số có thứ tự OWA (Ordered Weighted
Averaging) được R.Yager đưa ra vào năm 1988 [51], các tính chất và công
dụng đã được giới thiệu chi tiết, đầy đủ trong những năm tiếp sau. Lớp toán
tử này có tính chất trọng số thứ tự nên giá trị được tích hợp luôn nằm giữa
hai phép toán logic là phép tuyển “OR” và phép hội “AND”.
Trong luận án này, khi cần thiết kết nhập các mệnh đề, chúng tôi sử
dụng toán tử trung bình có trọng số.
Định nghĩa 1.2 [51] Toán tử trung bình có trọng số n chiều là ánh xạ f:
Rn → R cùng với vectơ kết hợp n chiều W = [w1, w2, …, wn]T (wi [0,1], w1 +
w2 + …+ wn = 1, i = 1,…, n) được xác định bởi công thức f(a1, a2, …, an) =
n


Một cách tổng quát khi  và  tương ứng là các phép t-norm và tconorm bất kỳ, ( A  B)  ( A V ) có hàm thuộc là:

 ( x, y)  S (T ( A ( x),  B ( y)), N ( A ( x)))
Nếu J là hàm chỉ giá trị chân lý của mệnh đề điều kiện, tức là J là ánh
xạ đi từ tích [0,1] × [0,1] vào [0,1], thì ta có:

(x, y) = J(A(x), B(y)), với J(a, b) = S[T(a, b),N(a)].
Chúng ta dễ dàng kiểm tra các điều kiện biên sau:
J(0, 0) = J(0, 1) = J(1, 1) = 1 và J(1, 0) = 0.
Định nghĩa 1.3. Một hàm J : [0,1]×[0,1]  [0,1] bất kỳ thỏa mãn điều
kiện biên trên được gọi là toán tử kéo theo mờ.
Phép kéo theo có ý nghĩa rất quan trọng trong việc xây dựng các
phương pháp lập luận xấp xỉ.
4) Phép hợp thành các quan hệ mờ
Quan hệ mờ là sự mở rộng của khái niệm quan hệ thông thường trong
toán học. Quan hệ mờ cho phép chúng ta biểu thị mối quan hệ giữa các đối
tượng một cách mềm dẻo hơn, chẳng hạn nó có thể biểu diễn cho một các
phát biểu “A trẻ hơn B khá nhiều”, “x rất lớn so với y”,...
Như chúng ta đã biết, một quan hệ thông thường của các tập U và V là
một tập con của U×V và do đó ta có thể mở rộng thành quan hệ mờ của U và
V. Một quan hệ mờ R là một tập con mờ của U×V, tức là:
R : U×V [0,1]
với R(x, y) chỉ cho mức độ cặp (x, y) thỏa hay thuộc vào quan hệ R.
Ví dụ với quan hệ R = “x nhỏ hơn y khá nhiều” thì R(10, 15) = 0.4 được
hiểu là mệnh đề khẳng định “10 nhỏ hơn 15 khá nhiều” có độ tin cậy là 0.4.

22


Cho R1 và R2 là các quan hệ mờ tương ứng trên U×V và V×W. Phép hợp

tắc để sinh ra các giá trị này. M là luật gán ngữ nghĩa sao cho mỗi một giá trị

23


ngôn ngữ sẽ được gán với một tập mờ. Chẳng hạn, đối với giá trị nguyên
thủy cao, M(cao)= {(u, cao(u) | u  [140, 190]}, được gán như sau:
0,

cao(u) =  u  165 ,
 10
1,

u  165
165  u  175
175  u

I.3. Phân hoạch mờ
Phân hoạch mờ là một khái niệm được sử dụng để mờ hóa các miền xác
định của các biến ngôn ngữ. Chúng ta có định nghĩa phân hoạch mờ như sau.
Định nghĩa 1.5. [38] Cho m điểm cố định p1


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status