PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ - Pdf 37

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Phạm Đình Phong

PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ
HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ
VÀ ĐẠI SỐ GIA TỬ

Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2016

Công trình được hoàn thành tại: Trường Đại học Công nghệ, Đại học
Quốc gia Hà Nội

Người hướng dẫn khoa học: GS. TS. Nguyễn Thanh Thủy
PGS. TSKH. Nguyễn Cát Hồ

Phản biện: .............................................................................................
..............................................................................................
Phản biện: .............................................................................................
..............................................................................................
Phản biện: .............................................................................................
..............................................................................................

Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận

trên luật ngôn ngữ mờ (FLRBC) được nghiên cứu rộng rãi do người dùng cuối có thể sử
dụng những tri thức dạng luật được trích rút từ dữ liệu có tính dễ hiểu, dễ sử dụng đối với
con người như là những tri thức của họ. Tiếp cận lý thuyết tập mờ không vận dụng các từ
ngôn ngữ nhằm truyền đạt ngữ nghĩa của các từ do thiếu một cầu nối hình thức giữa các từ
với các tập mờ tương ứng. Đại số gia tử (ĐSGT) cung cấp một cơ chế hình thức sinh các
tập mờ từ ngữ nghĩa định tính của các từ ngôn ngữ đã được ứng dụng một cách hiệu quả
vào quá trình thiết kế tập giá trị ngôn ngữ cùng với ngữ nghĩa tính toán dựa trên tập mờ
tam giác của chúng cho bài toán xây dựng tự động cơ sở luật cho FLRBC.
Câu hỏi được đặt ra là việc sử dụng các tập mờ hình thang để biểu diễn ngữ nghĩa tính
toán dựa trên tập mờ của các từ ngôn ngữ trong cơ sở luật của FLRBC có hiệu quả hơn
việc sử dụng các tập mờ tam giác? Trong các nghiên cứu của mình, Yager đã khẳng định
rằng, tập mờ tam giác chỉ là trường hợp đặc biệt của tập mờ hình thang khi điểm mút trái
và điểm mút phải của đáy nhỏ của hình thang trùng nhau. Điều này có nghĩa là việc sử
dụng các tập mờ hình thang trong biểu diễn ngữ nghĩa tính toán của các từ ngôn ngữ mang
tính phổ quát hơn và linh hoạt hơn so với các tập mờ hình tam giác. Tuy nhiên, cho tới
nay, chưa có một cơ chế hình thức toán học nào cho việc sinh các tập mờ hình thang từ
ngữ nghĩa định tính của các từ ngôn ngữ.
Mục tiêu đặt ra của luận án: Thứ nhất là xây dựng một cơ chế hình thức toán học cho
việc sinh tự động ngữ nghĩa tính toán dựa trên tập mờ hình thang từ ngữ nghĩa định tính
của các từ ngôn ngữ cho bài toán thiết kế tự động cơ sở luật cho hệ phân lớp dựa trên luật
ngôn ngữ mờ. Thứ hai là nghiên cứu và đề xuất một số cải tiến trong thiết kế tự động hệ
phân lớp dựa trên luật ngôn ngữ mờ với ngữ nghĩa tính toán của từ ngôn ngữ được xác
định dựa trên ĐSGT nhằm nâng cao chất lượng của hệ phân lớp.
Với các mục tiêu đặt ra của luận án, các đóng góp của luận án là:


Đề xuất mở rộng lý thuyết đại số gia tử mô hình hóa lõi ngữ nghĩa của các từ ngôn
ngữ nhằm cung cấp một cơ chế hình thức cho việc sinh tự động ngữ nghĩa tính
toán dựa trên tập mờ hình thang của khung nhận thức ngôn ngữ cho bài toán thiết
kế tự động hệ phân lớp dựa trên luật ngôn ngữ mờ.

FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT.
CHƯƠNG 1
TỔNG QUAN VỀ HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ MỜ
1.1. MỘT SỐ KHÁI NIỆM CƠ BẢN
1.1.1. Tập mờ
1.1.2. Biến ngôn ngữ
1.1.3. Phân hoạch mờ
1.1.4. Luật ngôn ngữ mờ và hệ luật ngôn ngữ mờ
Luật ngôn ngữ mờ hay luật mờ if-then, được gọi tắt là luật mờ, là một phát biểu có
điều kiện dưới dạng if A then B. Phần if của luật được gọi là giả thuyết hay tiền đề luật,
phần then của luật được gọi là phần kết luận.
1.1.5. Hệ suy luận mờ
Suy luận xấp xỉ hay suy luận mờ là quá trình suy ra các kết luận dưới dạng các mệnh
đề mờ hay luật mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước
cũng không cần xác định.
1.1.6. Bài toán phân lớp dữ liệu
Bài toán phân lớp dữ liệu P được phát biểu như sau: cho một tập dữ liệu mẫu D = {(dp,
Cp), p = 1, …, m}, trong đó m là số mẫu dữ liệu, dp = [dp,1, dp,2, ..., dp,n] là dòng thứ p trong
m mẫu dữ liệu có n thuộc tính, C = {Cs | s = 1, …, M} là một tập gồm M nhãn lớp.
Quá trình xây dựng mô hình phân lớp thường được chia thành hai bước:
2

Bước 1. Huấn luyện: mô hình phân lớp được xây dựng dựa trên các tập dữ liệu mẫu đã
được gán nhãn, được gọi là các tập dữ liệu huấn luyện.
Bước 2. Thử nghiệm mô hình: sử dụng mô hình đã được xây dựng tại bước 1 để phân
lớp tập dữ liệu mới đã được gán nhãn được chọn ngẫu nhiên và độc lập với tập dữ liệu
huấn luyện.
1.2. HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ LUẬT MỜ
1.2.1. Cấu trúc của hệ dựa trên luật ngôn ngữ mờ

trợ (support) làm tiêu chuẩn sàng để sàng lọc ra các luật ứng viên:

trong đó

⟹

=

⟹

=

∑ ∈

.

(1.3)

.

(1.4)

∑
∑ ∈

(

}.

(1.6)

- Các luật có thể được gán trọng số luật, công thức sau thường được sử dụng:
=

⟹

−

,

,

(1.9)

cq,2nd là độ tin cậy lớn nhất của các luật có cùng điều kiện Aq nhưng khác kết luận khác Cq.
= max

,

⟹

ℎ |ℎ = 1, … ,

;ℎ ≠

,

(1.15)

1.2.3. Những vấn đề tồn tại
- Hầu hết các đề xuất theo hướng tiếp cận lý thuyết tập mờ vẫn thiếu một cơ chế hình
thức liên kết giữa ngữ nghĩa vốn có của các từ ngôn ngữ với các tập mờ tương ứng của
chúng; thiếu một cơ sở hình thức hóa toán học trong thiết kế tự động ngữ nghĩa tính toán
dựa trên tập mờ từ ngữ nghĩa vốn có của các từ ngôn ngữ, dẫn đến hệ phân lớp thu được
không là kết quả của sự tương tác giữa ngữ nghĩa của các từ ngôn ngữ với dữ liệu.
- Chưa có cơ chế hình thức đánh giá tính khái quát và tính cụ thể của các từ ngôn ngữ
và bài toán thiết kế các thể hạt (granularity) cho các phân hoạch mờ trên miền các thuộc
tính đảm bảo sự cân bằng giữa tính khái quát và tính cụ thể của các từ ngôn ngữ chưa được
đặt ra.
1.3. Đại số gia tử
1.3.1. Đại số gia tử của biến ngôn ngữ
Định nghĩa 1.4. [49] Giả sử X là một biến ngôn ngữ có miền giá trị là Dom(X). Một ĐSGT
AX tương ứng của X là một bộ 5 thành phần AX = (X, G, C, H, ≤), trong đó: (X, ≤) là cấu
trúc dựa trên quan hệ thứ tự, X là một tập giá trị ngôn ngữ của X với X  Dom(X) và ≤ là
quan hệ thứ tự được cảm sinh bởi ngữ nghĩa vốn có của các từ ngôn ngữ trên X; G = {c-,
c+} là tập các phần tử sinh có quan hệ ngữ nghĩa c- ≤ c+, trong đó c- và c+ tương ứng là
phần tử sinh nguyên thủy âm và dương; C = {0, W, 1} là tập các hằng thỏa quan hệ ngữ
nghĩa 0 ≤ c- ≤ W ≤ c+ ≤ 1, trong đó 0 và 1 tương ứng là phần tử nhỏ nhất và phần tử lớn
nhất trong cấu trúc (X, ≤), W là phần tử trung hòa; H là tập gia tử của biến ngôn ngữ X. 
Với mỗi x  X, ký hiệu H(x) là tập tất cả các giá trị ngôn ngữ u  X được cảm sinh từ
x bởi các gia tử trong H và được biểu diễn bởi chuỗi u = hn…h1x, với hn, …, h1  H.
4

Trong trường hợp x  {c-, c+} thì chuỗi u = hn…h1c được gọi là một biểu diễn chính tắc
nếu hj+1…h1c ≠ hj…h1c với mọi j = 1, …, n - 1 và khi đó u có độ dài n + 1, được ký hiệu là
|u| hoặc l(u). Ký hiệu sau: Xk là tập tất cả các giá trị ngôn ngữ có độ dài đúng bằng k và X(k)

H(x) của một từ ngôn ngữ x tới một khoảng nằm trong đoạn [0, 1], được gọi là khoảng tính
mờ của x và được ký hiệu là (x). Độ dài của (x) được gọi là độ đo tính mờ của x và
được ký hiệu là fm(x). Với ý tưởng trên, độ đo tính mờ được tiên đề hóa như sau:
Định nghĩa 1.5. Một hàm fm: X  [0, 1] được gọi là một độ đo tính mờ của biến ngôn
ngữ X, nếu nó có các tính chất sau:
(FM1) fm là một độ đo đầy đủ trên X, nghĩa là fm(c) + fm(c+) = 1 và, u  X,
5

 fm(hu)  fm(u) ;

hH

(FM2) Nếu H(x) = x, thì fm(x) = 0. Đặc biệt ta có: fm(0) = fm(W) = fm(1) = 0;
(FM3) x, y  X, h  H, ta có fm(hx)/x = fm(hy)/y, nghĩa là tỷ số này không phụ thuộc
vào một phần tử cụ thể nào trong X mà chỉ phụ thuộc vào h được gọi là độ đo tính mờ của
gia tử h và được ký hiệu là (h). 
Công thức tính đệ quy độ đo tính mờ của x = hm...h1c với c  {c-, c+} như sau:
fm(x) = (hm)...(h1) fm(c), trong đó

  ( h)  1 .

(1.17)

hH

Mệnh đề 1.1. [51, 52] Độ đo tính mờ fm của các khái niệm và (h) của các gia tử thỏa:
1)

fm(hx) = (h)fm(x), x  X;

Định nghĩa 1.6. Ngữ nghĩa số của các từ ngôn ngữ hay ánh xạ định lượng ngữ nghĩa của
AX là ánh xạ bảo toàn thứ tự υ: X  [0,1] thỏa mãn các điều kiện sau:
SQM1) υ bảo toàn thứ tự trên X, tức là x < y  υ(x) < υ(y) và υ(0) = 0, υ(1) = 1;
SQM2) υ là song ánh và ảnh của X, υ(X), là trù mật trong đoạn [0, 1] ; 
Mệnh đề 1.2. Ánh xạ định lượng ngữ nghĩa nhờ tính mờ là ánh xạ υ được xác định:
1) υ(W) =  = fm(c), υ(c) =  - fm(c), υ(c+) =  +fm(c+);
j

2) υ(hjx) = υ(x)+ Sign ( h j x )(  i 1 fm ( hi x )   ( h j x ) fm ( h j x )) , với 1  j  p,
j

và υ(hjx) = υ(x)+ Sign ( h j x )(  i  1 fm ( hi x )   ( h j x ) fm ( h j x )) , với q  j  1.
Hai công thức này có thể viết thành một công thức chung, với j  [-q^p] và j  0 là:
j

 ( h j x )   ( x )  Sign ( h j x )(  i  sign ( j ) fm ( hi x )   ( h j x ) fm ( h j x )) , và
 ( h j x )  1 2 [1  Sign ( h j x ) Sign ( h p h j x )(    )]  { ,  } . 
1.3.3. Ý nghĩa ứng dụng của đại số gia tử
ĐSGT đã được ứng dụng thành công trong các lĩnh vực như điều khiển mờ, hồi quy
và dự báo, thiết kế FLRBC, ... Trong những ứng dụng như vậy, ngữ nghĩa của các từ ngôn
ngữ được sử dụng trong biểu diễn các luật ngôn ngữ mờ cần được biểu thị bằng tập mờ
phù hợp với ngữ nghĩa vốn có của chúng. Với độ đo tính mờ của |H| - 1 gia tử, độ đo tính
mờ của một phần tử sinh (fm(c-) hoặc fm(c+)) và một số nguyên dương k giới hạn độ dài tối
6

đa của các từ ngôn ngữ được gọi là các tham số ngữ nghĩa, ký hiệu là Л. Khi cho một bộ
giá trị cụ thể của các tham số ngữ nghĩa, các giá trị định lượng của các từ ngôn ngữ được
tính toán và ngữ nghĩa tính toán dựa trên tập mờ của chúng được xây dựng. Giá trị định

200

Hình 2.1. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngôn ngữ TOCDO và
các giá trị của tập nền U được biểu diễn dưới dạng các tập mờ.
Mọi từ mang ngữ nghĩa không rõ ràng x của một biến ngôn ngữ với miền tham chiếu
số U biểu diễn mối quan hệ của x với các giá trị của U, tức là mọi giá trị số của U phù hợp
với x ở một độ chắc chắn nhất định. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến
ngôn ngữ TOCDO và các giá trị của U có thể được biểu diễn dưới dạng các tập mờ như
trong Hình 2.1. Ký hiệu Core(x) là lõi ngữ nghĩa của của x thì Core(x) = {(u, x(u)): x(u)
7

= 1} và ngữ nghĩa của x là tập Sem(x) = {(u, x(u)): x(u)  [0, 1]}. Lõi ngữ nghĩa của hai
từ ngôn ngữ bất kỳ x, y  X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau:
(C1) Core(x)  Sem(x);
(C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y).
Trong phương pháp hình thức hóa ĐSGT, lõi ngữ nghĩa của từ ngôn ngữ x cần được
sinh từ gia tử nên một gia tử nhân tạo h0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x
là h0x. Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau.
Định nghĩa 2.1. Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C, G, H,
) là ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ), trong đó C cũng là tập các hằng tử của
AXmr, Hmr = HI  {h0} = H+  H  {I, h0}, ở đó H = {h-q, …, h-2, h-1}, h-q < ... < h-2 < h-1
và H+ = {h1, h2 ,... , hp}, h1 < h2 < ... < hp, nghĩa là HI = H  {I}, Xmr = X  {h0x | x  X}
và ≤ là quan hệ thứ tự mở rộng của X trên Xmr, nếu nó thỏa các tiên đề sau:
(A1) Toán tử đơn vị V (phần tử lớn nhất) trong H+ là dương hoặc âm đối với đối với
mọi gia tử trong H. Chẳng hạn V là dương đối với chính nó và đối với L trong H-.
(A2) Nếu u, v  X là độc lập, tức là u  HI(v) và v  HI(u) thì x  HI(u)  x  HI(v).
(A3) Kế thừa gia tử: Với x  X, h, k, h’, k’  H, ta có:
(i) x ≠ hx  x  HI(hx).
(ii) h ≠ k & hx  kx  h’hx  k’kx.

∈

(

)}

⟺ℎ

hH mr

∈ (

 ( h)  1 ;
)

(ℎ

)+∑

∈

( ) = 1 với ∀ > 0. Với k = 1, ta có (fm1). 

2.3. HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ
Gọi PI([0, 1]) là tập tất cả các khoảng con của đoạn [0, 1]. Ta luôn luôn quy ước là các
khoảng đều đóng ở đầu mút trái và mở ở đầu mút phải, trừ khi đầu mút phải là giá trị 1. Ta
có khái niệm khoảng tính mờ  của các từ ngôn ngữ của Xmr, (x) với ∈ ( ) =
{ ∈
: | | ≤ } = ( ) ∪ {ℎ : ∈ ( ) }, dựa trên hệ tiên đề của độ đo tính mờ:
Định nghĩa 2.3. Cho một ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ) của một ĐSGT tuyến
tính và tự do AX và độ đo tính mờ fm: Xmr  [0, 1] thỏa các tính chất trong Định nghĩa
2.2. Giả sử mỗi từ ngôn ngữ x  ( ) được liên kết với một khoảng trong PI([0, 1]). Các
khoảng này được gọi là các khoảng tính mờ mức k của các từ ngôn ngữ tương ứng của
AXmr và nó được xây dựng quy nạp theo k như sau:
1) Với k = 1, xây dựng các khoảng tính mờ 1(c-), 1(W), 1(c+) với |1(x)| = fm(x),
sao cho chúng có thứ tự tương đồng với thứ tự của các hạng từ c-, W, c+.
9

(1) Với mỗi x thỏa |x| = k, khoảng tính mờ mức k của x, k(x), thỏa |k(x)| = fm(x), còn
với x mà |x| < j  k, k(x) = I(h0x) và |k(x)| = (h0)fm(x), tức là các hạng từ độ dài ngắn
hơn j có mặt trong ngữ cảnh cùng các hạng từ độ dài j sẽ có ngữ nghĩa bị co lại;
(2) Với mọi x 

( )

thỏa |x| = j < k, ta có k(x) = I(h0x) và |k(x)| = (h0)fm(x). Với x

thỏa |x| = j  k – 2, ta có k(x) = k-1(x).
(3) Tập tất cả các khoảng tính mờ mức k, FI(k) = {k(x), x 

( ) },

có các tính chất:

a- Đối với hạng từ hằng W, ta có k(W) = 1(W);
b- Với mỗi x  H({c,c+}) thỏa |x| = k – 1, tập các khoảng tính mờ {k(hx): h  Hmr}
là một phân hoạch nhị phân của khoảng tính mờ k-1(x) mức k – 1 của x.
c- Các khoảng tính mờ trong FI(k) có thứ tự tương đồng với thứ tự của các hạng từ của
chúng và lập thành một phân hoạch nhị phân của đoạn [0,1]. 
2.4. ÁNH XẠ NGỮ NGHĨA ĐỊNH LƯỢNG KHOẢNG
Định nghĩa 2.4. Cho AXmr là ĐSGT mở rộng của AX tuyến tính và tự do, ánh xạ f : Xmr 
PI([0, 1]) được gọi là ánh xạ định lượng khoảng của AXmr nếu nó thỏa các điều kiện sau:
(IQ1) f bảo toàn thứ tự trên Xmr, tức là nếu x  y thì f(x)  f(y), với x, y  Xmr;
(IQ2) f(Xmr) là tập trù mật trong [0, 1]. 
10

Định lý 2.5. Cho độ đo tính mờ fm của ĐSGT AXmr và  là tập tất cả các khoảng tính mờ

&
Công thức (2.6) chưa thể hiện mối quan hệ giữa giá trị định lượng và các tham số của
từ. Định lý sau cung cấp công thức đệ quy tính L(f(x)). Giả sử H+ = {hj: j = 1, …, p}, H- =
{ hj: j = -1, …, -q}, = ∑
(ℎ ) và = ∑
(ℎ ). Ta có, + + (ℎ ) = 1.
Định lý 2.6. Điểm mút trái của giá trị định lượng f được cảm sinh bởi các độ đo tính mờ
fm được tính đệ quy theo thủ tục sau:
(1) Với các từ có độ dài 1: L(f(0)) = 0, L(f(c-)) = fm(0) +  × fm(c-), L(f(W)) = fm(0) +
fm(c-), L(f(c+)) = fm(0) + fm(c-) + fm(W) và L(f(1)) = 1 - fm(1).
(2) Với y = hjx, x  X: đặt (x) = {1 + Sign(hjx)[(h0x) + Sign(hphjx)( - )]}/2, thì
L(f(hjx)) = L(f(x)) + Sign(hjx) × fm(x) × {
∑

( )

1+

ℎ

× (ℎ ) +

(ℎ ) − ( ) × (ℎ )}.

2.6. ỨNG DỤNG LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG TRONG
THIẾT KẾ HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN NGỮ MỜ
Luận án áp dụng phương pháp hai giai đoạn thiết kế FLRBC với ngữ nghĩa tính toán
của các từ được xác định bởi ĐSGT AXmr và AXmrtp, điểm khác biệt so với ĐSGT AX:
1) Thứ nhất, trong bước thiết kế các từ ngôn ngữ cho các thuộc tính của tập dữ liệu
huấn luyện, mỗi thuộc tính được liên kết với một ĐSGT AXmr hoặc AXmrtp thay vì AX. Tập

fm(1j), (hj,i), (h0,j)}. Khi cho các giá trị cụ thể của các tham số mờ, tất cả các khoảng tính
mờ ℑ
mức k ≤ kj và f(xj,i) của các từ trong ,( ) được xây dựng và tạo thành một
,
phân hoạch trên [0, 1]. Do

(

,

)ℑ (

,

), nên ta có (

,

)≤⋯≤ (

,

,

). Ký

kiệu L(•) và R(•) lần lượt là điểm mút trái và mút phải của một khoảng bất kỳ. Giả sử đặt a
= R(f(xj,i-1)), b = L(f(xj,i)), c = R(f(xj,i)), d = L(f(xj,i+1)), ta có công thức tính giá trị hàm thuộc
của tập mờ hình thang , ( ) của từ xj,i theo (2.7), trong đó v là một điểm dữ liệu.

b. Ngữ nghĩa tính toán dựa trên tập mờ hình thang của các từ có độ dài 2.
Hình 2.7. Các tập mờ được thiết kế theo cấu trúc đa thể hạt được sinh bởi ĐSGT AXmr.

2.6.2. Sinh tập luật khởi đầu từ dữ liệu dựa trên ngữ nghĩa ĐSGT mở rộng
Đặt Л =  {

 {kj} | j = 1, …, n} với AXmr hoặc Л =  {

 {kj} | j = 1, …,

n} với AXmrtp và gọi chung các giá trị trong Л là các tham số ngữ nghĩa. Thủ tục xây dựng
tập luật khởi đầu từ mt mẫu dữ liệu của D là E_IFRG(Л, D, NR0, K, λ) như sau:
Thuật toán 2.2. E_IFRG (Thuật toán sinh tập luật khởi đầu).
Input: Tập mẫu dữ liệu D = {(dp, Cp) | p = 1, …, mt}, M lớp kết luận, n thuộc tính, các
tham số ngữ nghĩa Л, NR0 số luật khởi đầu, K giới hạn độ dài của các từ ngôn ngữ, λ giới
hạn độ dài tối đa của luật.
Output: Tập luật khởi đầu S0.
Begin
Bước 1: Xây dựng tập các hạng từ, tập khoảng tính mờ, tập ánh xạ định lượng khoảng
và các tập mờ hình thang của các từ đối với mọi thuộc tính của tập dữ liệu huấn luyện.
Bước 2: Sinh tập luật ứng viên từ tập dữ liệu huấn luyện.
Tập các khoảng tính mờ ℑ (

, ( ))

chứa thành phần dữ liệu dl,j xác định một khối hộp

Hl chứa mẫu dữ liệu dl. Khối hộp Hl cùng với lớp kết luận Cl của pl xác định luật mờ cơ sở
độ dài n có dạng sau:

đặt ra là phải chọn ra một tập luật con của S0 cho FLRBC sao cho đạt các mục tiêu sau:
maximize perf(S), maximize NR(S)-1 và maximize avg(S)-1
(2.10)
với ràng buộc S  S0, NR(S)  Nmax.
trong đó NR(S)-1 là nghịch đảo của số luật trung bình và Nmax là số luật tối đa được chọn và
được xác định trước. Mỗi cá thể ứng với mỗi lời giải là một tập luật S được chọn từ S0 và
được biểu diễn bởi một chuỗi số thực ri = (p1, ..., pNmax), pj  [0, 1]. Giá trị pj xác định chỉ
số của luật trong S0 được chọn cho S có giá trị là pj × |S0|, ta có 0  pj × |S0| < |S0|.
S = {Ri  S0 | i = pj × |S0|, i ≥ 0}

(2.11)

trong đó • là phép lấy phần nguyên.
2.7. KẾT LUẬN CHƯƠNG 2
Chương này nghiên cứu phát triển mở rộng lý thuyết ĐSGT nhằm mô hình hóa lõi ngữ
nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình thang và ứng dụng trong thiết kế tự
động FLRBC.
CHƯƠNG 3
CÀI ĐẶT MÔ PHỎNG TRÊN MÁY TÍNH VÀ SO SÁNH ĐÁNH GIÁ
3.1. CÀI ĐẶT THỰC NGHIỆM
3.1.1. Giải thuật tối ưu bầy đàn đa mục tiêu
Giải thuật PSO đa mục tiêu (MOPSO) dựa trên khái niệm chia sẻ thích nghi được
Lechuga M. S. đề xuất năm 2006 như sau:
Thuật toán 3.1. MOPSO (Giải thuật tối ưu đa mục tiêu PSO)
Đầu vào: Cấu hình cần được huấn luyện;
Đầu ra: Cấu hình là kết quả của quá trình huấn luyện.

Begin
Bước 1: Các biến popi, pbesti, gbesti, fSharei được khởi tạo. Biến fSharei được tính như sau:
fSharei =

End.
3.1.2. Giải bài toán tối ưu các từ ngôn ngữ và tìm kiếm hệ luật tối ưu bằng MOPSO
Tối ưu các tham số ngữ nghĩa sử dụng giải thuật MOPSO là MOPSO_SPO.
Thuật toán 3.2. MOPSO_SPO (Tối ưu các tham số ngữ nghĩa)
Đầu vào: Cấu hình đầu vào
Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt.

Begin
Cụ thể hóa Giải thuật 3.1 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa cần tối ưu;
Trả lại tập các giá trị tốt nhất của các tham số ngữ nghĩa Лopt;

End.
3.1.3. Dữ liệu và phương pháp thực nghiệm
Các thực nghiệm được tiến hành đối với 23 tập dữ liệu mẫu UCI được cộng đồng
nghiên cứu thừa nhận bao gồm: Appendicitis, Australian, Bands, Bupa, Cleveland,
Dermatology, Glass, Haberman, Hayes-roth, Heart, Hepatitis, Ionosphere, Iris,
Mammographic, Newthyroid, Pima, Saheart, Sonar, Tae, Vehicle, Wdbc, Wine, Wisconsin.
Phương pháp kiểm tra chéo 10 nhóm (10-fold cross-validation) được sử dụng và được lặp
lại 3 lần đối với một tập dữ liệu được thử nghiệm. Kết quả cuối cùng của các lần thử
nghiệm sau khi lựa chọn được hệ luật tối ưu được tính trung bình đối với số luật #R, độ
phức tạp của hệ luật #C, tỷ lệ phân lớp đúng trên tập huấn luyện Ptr và trên tập kiểm tra
Pte. Độ phức tạp của hệ luật được tính theo công thức #C = #R × Avg, trong đó Avg là độ
dài trung bình của hệ luật.
Số thế hệ khi tối ưu các tham số ngữ nghĩa MOPSO_SPO là 250, tìm kiếm hệ luật tối
ưu MOPSO_RBO là 1000. Số cá thể mỗi thế hệ là 600.
Các ràng buộc đối với các tham số ngữ nghĩa như sau: số gia tử âm và gia tử dương
đều được lấy là 1. Giới hạn độ dài của các từ ngôn ngữ 0 < kj ≤ 3. Giá trị của các độ đo
tính mờ: Với ĐSGT AXmr: 0,2 ≤
( ), (Lj) ≤ 0,7; 0,0001 ≤ fm(Wj) ≤ 0,2;
+

thuyết thống kê Wilcoxon Signed Rank đối với hiệu suất phân lớp và độ phức tạp của hệ
luật, ta có thể kết luận rằng, các tiếp cận thiết kế hệ phân lớp dựa trên phương pháp luận
ĐSGT AX, AXmr, AXmrtp sử dụng phương pháp lập luận single winner rule đều cho hiệu
suất phân lớp tốt hơn so với phương pháp lập luận weighted vote tương ứng.
3.4. SO SÁNH CÁC PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP THEO TIẾP
CẬN ĐSGT
Ký hiệu phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của từ được xác định
dựa trên ĐSGT AX, ĐSGT AXmr và ĐSGT AXmrtp tương ứng là FRBC_AX, FRBC_AXmr và
FRBC_AXmrtp. Theo các kết quả thực nghiệm trong Bảng 3.14, hệ phân lớp FRBC_AXmrtp
cho kết quả phân lớp trên tập kiểm tra cao hơn so với hệ phân lớp FRBC_AX đối với 19
tập dữ liệu và cao hơn so với hệ phân lớp FRBC_AXmr đối với 15 tập dữ liệu trong số 23
tập dữ liệu mẫu được thực nghiệm. Với các kết quả kiểm định thống kê Wilcoxon Signed
Rank, ta có thể khẳng định rằng, việc ứng dụng ĐSGT AXmrtp trong thiết kế FLRBC cho
hiệu suất phân lớp tốt hơn so với việc ứng dụng ĐSGT AXmr và ĐSGT AX, ĐSGT AXmr
cho hiệu suất phân lớp tốt hơn ĐSGT AX.
Bảng 3.14. So sánh các kết quả thực nghiệm giữa hệ phân lớp FRBC_AXmrtp và hai hệ
phân lớp FRBC_AX và FRBC_AXmr.
Tập
dữ liệu
App
Aus
Ban
Bup
Cle
Der
Gla
Hab
Hay
Hea
Hep

79,78
66,64
96,37
78,78
77,60
89,40
89,19
93,68

88,15
87,15
73,46
72,38
62,39
94,40
72,24
77,40
84,17
84,57
89,28

21,32
36,20
52,20
187,20
657,43
198,05
343,60
10,20
122,27

0,60
0,77
0,66
4,29
0,20
-1,67
0,15
1,64
0,00
0,13
0,84

16

-4,55
10,30
6,00
-6,00
-189,3
-15,22
130,69
0,60
-7,61
0,57
-0,63

#C
16,91
41,85

63,40
95,52
72,78
77,43
83,33
84,57
89,17

≠Pte

≠R×C

0,06
-0,14
0,29
4,65
1,36 -19,99
2,97
10,50
-1,01 -172,05
-1,12
-6,63
-0,54 -14,09
-0,03
-9,20
0,84 -24,76
0,00
2,60
0,11
-0.22

85,49
96,76
78,69
75,51
87,59
68,97
70,74
97,08
99,60
97,78

91,56 90,33 95,35 90,22 1,34
97,33 26,29 98,40 96,00 1,33
84,20 92,25 86,05 84,20 0,00
95,67 45,18 97,02 94,42 1,25
77,01 60,89 78,28 76,18 0,83
70,05 86,75 76,35 69,33 0,72
78,61 79,76 88,39 76,80 1,81
61,00 261,00 72,11 59,47 1,53
68,20 242,79 70,30 67,62 0,58
96,78 37,35 97,62 96,96 -0,18
98,49 35,82 99,88 98,30 0,19
96,95 74,36 97,81 96,74 0,21

TB

114,78 86,16 82,67 126,53 86,77 81,92

-2,30
4,08

86,84
68,36
71,64
97,16
100,0
97,20

90,98
96,67
84,46
95,03
76,66
70,27
77,29
59,46
68,12
95,96
98,52
96,51

0,58
0,66
-0,26
0,64
0,35
-0,22
1,32
1,54
0,08
0,82

thống kê Wilcoxon Signed Rank, ta có thể khẳng định rằng cả hai hệ phân lớp
FRBC_AXmr và FRBC_AXmrtp đều tốt hơn so với các phương pháp được đề xuất trong R.
Alcalá, 2011 về hiệu suất phân lớp nhưng không tăng độ phức tạp của hệ phân lớp.
Bảng 3.17. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AXmr so với hai hệ
phân lớp All Granularities và Product-1-ALL TUN.
Tập
dữ
liệu
App
Aus
Ban
Bup
Cle
Der
Gla
Hab
Hay
Hea
Hep
Ion
Iri
Mam
New

FRBC_AXmr
#C
16,91
41,85
78,19
170,70

98,35
85,31
96,30

88,09
86,86
72,10
69,41
63,40
95,52
72,78
77,43
83,33
84,57
89,17
90,98
96,67
84,46
95,03

#C
8,84
4,00
57,18
112,59
1132,14
220,36
408,83
90,55
140,03

#C

87,91 0,18
8,07
20,89
85,51 1,35 37,85
62,43
68,73 3,37 21,01 104,09
63,99 5,42 58,11 210,91
55,11 8,29 -491,95 1020,66
94,12 1,40 -30,90 185,28
60,48 12,30 79,54 534,88
71,89 5,54 -70,55
21,13
78,03 5,30 -0,61 158,52
83,46 1,11 11,24 164,61
20,29
90,44 -1,27 -9,59
88,62 2,36 -57,62
86,75
95,11 1,56
7,19
18,54
81,04 3,42 -20,38 106,74
91,78 3,25 -18,48
56,47

17

88,53
90,79
97,33
80,49
94,60

≠Pte ≠R×C
0,79
1,21
6,30
2,22
4,60
1,04
1,50
5,55
4,45
1,73
0,64
0,19
-0,66
3,97
0,43

-3,98
-20,58
-25,90
-40,21
-380,47
4,18
-46,50

86,84
68,36
71,64
97,16
100,0
97,20

76,66 95,01 77,80 74,92
70,27 76,24 76,70 71,14
77,29 70,67 86,54 78,88
59,46 147,09 66,55 54,57
68,12 492,55 69,34 62,81
95,96 55,74 97,12 94,90
98,52 32,10 100,0 96,08
96,51 77,41 98,22 96,07

TB

123,05

86,04 82,29 160,29 85,74 79,37

1,74
-0,87
-1,59
4,89
,31
1,06
2,44
0,44

70,13
78,90
60,78
66,16
94,90
93,03
96,35

-0,39
0,14
-1,61
-1,32
1,96
1,06
5,49
0,16

-6,87
-52,43
6,32
-52,31
-165,93
-21,19
-16,90
-9,31

87,36 80,57

Bảng 3.20. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AXmrtp so với hai hệ
phân lớp All Granularities và Product-1-ALL TUN.

All Granularities

Pte

16,77
46,50
58,20
181,19
468,13
182,84
474,29
10,80
114,66
123,29
25,53
88,03
30,37
73,84
39,82
56,12
59,28
49,31
210,70
195,07
25,04
40,39
69,81

92,38
88,56

1,02 104,09
73,46
72,38 112,59 69,50 63,99 8,39 68,60 210,91
62,39 1132,14 73,11 55,11 7,28 -664,01 1020,66
94,40 220,36 99,07 94,12 0,28 -37,52 185,28
72,24 408,83 78,65 60,48 11,76 65,45 534,88
90,55 79,46 71,89 5,51 -79,75
21,13
77,40
84,17 140,03 90,88 78,03 6,14 -25,37 158,52
84,57 109,45 90,19 83,46 1,11 13,84 164,61
89,28
35,34 96,10 90,44 -1,16 -9,81
20,29
86,75
91,56 141,33 95,64 88,62 2,94 -53,30
27,40 99,11 95,11 2,22
2,97
18,54
97,33
84,20 102,46 83,07 81,04 3,16 -28,62 106,74
49,40 96,19 91,78 3,89 -9,59
56,47
95,67
77,01
95,01 77,80 74,92 2,09 -38,89
57,20
70,05
76,24 76,70 71,14 -1,09 -16,95 110,84
78,61

Product/1-ALL TUN
≠Pte

160,29 85,74 79,37

#C

163,0

Ptr

Pte

93,47
89,18
71,18
78,59
77,21
99,28
83,68
76,82
90,99
91,87
97,88
96,25
98,30
83,90
98,02
79,06

96,35

≠Pte ≠R×C
0,85
1,50
7,66
5,19
3,59
-0,08
0,96
5,52
5,29
1,73
0,75
0,77
0,00
3,71
1,07
-0,04
-0,08
-0,29
0,22
2,04
1,88
5,46
0,60

-4,12
-15,93
-45,89

Bảng 3.23. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AXmrtp và
FRBC_AXmr so với hệ phân lớp PAES-RCS.
Tập dữ
liệu

PAES-RCS
#C

Pte

FRBC_AXmrtp
#C

Pte

FRBC_AXmr
≠Pte

18

≠R×C

#C

Pte

≠Pte

≠R×C

1140,00
389,40
487,90
202,41
120,00
300,30
300,30
670,63
69,84
132,54
97,75
270,64
525,21
524,60
323,14
555,77
183,70
170,94
328,02
355,23

85,09
85,80
67,56
68,67
59,06
95,43
72,13
72,65
84,03

39,82
56,12
59,28
49,31
210,70
195,07
25,04
40,39
69,81
114,78

88,15
87,15
73,46
72,38
62,39
94,40
72,24
77,40
84,17
84,57
89,28
91,56
97,33
84,20
95,67
77,01
70,05
78,61
61,00

18,51
283,14
697,80
75,01
671,87
206,56
13,61
191,61
5,34
177,01
274,77
582,60
39,47
58,70
57,93
214,52
465,93
475,29
112,44
360,70
158,66
130,55
258,21

16,91
41,85
78,19
170,70
640,19
189,46

90,98
96,67
84,46
95,03
76,66
70,27
77,29
59,46
68,12
95,96
98,52
96,51
82,29

-3,00
-1,06
-4,54
-0,74
-4,34
-0,09
-0,65
-4,78
0,70
-1,36
-5,96
-0,58
-1,34
-1,09
0,32
-2,00

268.21

3.5. SO SÁNH ĐÁNH GIÁ VỚI MỘT SỐ TIẾP CẬN KHÁC
Các kết quả được đề xuất trong luận án được so sánh với kết quả của hai phương pháp
thiết kế hệ phân lớp không dựa vào cơ chế tiến hóa là FURIA và C4.5. FURIA (Fuzzy
Unordered Rules Induction Algorithm) là một mở rộng của giải thuật RIPPER với việc sử
dụng các luật mờ thay vì các luật rõ, khai thác từ các tập luật không được sắp xếp thay vì
các tập luật được sắp xếp. Hệ phân lớp C4.5 là hệ phân lớp dựa trên cây quyết định khai
thác khái niệm entropy thông tin. Các kết quả thực nghiệm và kiểm định giả thuyết thông
kê, ta có thể kết luận rằng cả hai hệ phân lớp FRBC_AXmr và FRBC_AXmrtp thực sự tốt
hơn FURIA và C4.5 cả về hiệu suất phân lớp lẫn độ phức tạp của hệ phân lớp.
3.7. KẾT LUẬN CHƯƠNG 3
Chương này trình bày các cài đặt thực nghiệm bao gồm dữ liệu thực nghiệm, phương
thức tiến hành thực nghiệm, các tham số, kết quả thực nghiệm và đánh giá so sánh.
CHƯƠNG 4
MỘT SỐ CẢI TIẾN TRONG THIẾT KẾ HỆ PHÂN LỚP DỰA TRÊN LUẬT
NGÔN NGỮ MỜ VỚI NGỮ NGHĨA DỰA TRÊN ĐSGT
Chương này trình bày việc áp dụng một số kỹ thuật làm tăng hiệu quả của phương
pháp thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ trên cơ sở đại số gia tử.
4.1. NÂNG CAO CHẤT LƯỢNG CỦA HỆ PHÂN LỚP DỰA TRÊN LUẬT NGÔN
NGỮ MỜ BẰNG CÁC GIẢI THUẬT TỐI ƯU
4.1.1. So sánh tính hiệu quả của giải thuật MOPSO so với giải thuật GSA
19

Theo các kết quả thực nghiệm, giải thuật tối ưu MOPSO cho hiệu quả phân lớp trung
bình trên tập kiểm tra cao hơn (80,83% so với 80,50%) và có độ phức tạp trung bình của
các hệ luật thấp hơn (141,64 so với 177,49) đáng kể so với giải thuật tối ưu GSA. Theo
các kết quả kiểm định thống kê, ta có thể kết luận rằng tiếp cận thiết kế hệ phân lớp dựa
trên phương pháp luận ĐSGT truyền thống AX sử dụng MOPSO cho kết quả tốt hơn so

đánh giá. Giá trị chia sẻ thích nghi của từng each particle được tính theo công thức (3.4).
Bước 2: Với mỗi i trong bầy đàn.
Bước 2.1: Tính tốc độ của velit 1 của particle i theo công thức (3.6).
Bước 2.2: Tính vị trí mới pop it 1 của particle i theo công thức (3.7).
Bước 2.3: Đánh giá các giá trị mục tiêu của particle thứ i.
Bước 2.4: Kiểm tra tiêu chuẩn tính trội giữa vị trí mới pop it 1 của particle i và vị trí cũ của nó
tại thế hệ trước đó
vị trí

pop it 1

pop it .

Nếu vị trí

pop it 1

trội hơn vị trí pop it , nghĩa là vị trí mới tốt hơn, thì

được chấp nhận là vị trí mới của particle i. Ngược lại, tính giá trị RMSR:
RMSR =

1
D

D
t 1
i, j

 ( fitness

Đầu ra: Tập các tham số ngữ nghĩa tối ưu Лopt;

Begin
Giải thuật này cụ thể hóa Giải thuật 4.2 với vị trí của mỗi cá thể là một bộ tham số ngữ nghĩa;
Trả lại tập các giá trị tốt nhất của các tham số ngữ nghĩa Лopt;

End.
4.1.2.3. Thực nghiệm so sánh giải thuật MOPSO-SA so với giải thuật MOPSO
Qua các kết quả thực nghiệm đối với 23 tập dữ liệu và các kết quả kiểm định
Wilcoxon Signed Rank, ta có thể kết luận rằng, việc sử dụng giải thuật tối ưu MOPSO-SA
trong thiết kế FLRBC với ngữ nghĩa ĐSGT AX cho hiệu suất phân lớp tốt hơn so với việc
sử dụng giải thuật MOPSO (82,48% so với 81,92%) và việc sử dụng giải thuật tối ưu
MOPSO-SA trong thiết kế FLRBC với ngữ nghĩa dựa trên ĐSGT AXmrtp không những cho
hiệu suất phân lớp tốt hơn (82,94% so với 82,67%) mà còn cho độ phức tạp trung bình
thấp hơn (107,52 so với 114,78) so với việc sử dụng giải thuật tối ưu MOPSO.
4.2. CẢI TIẾN PHƯƠNG PHÁP SINH LUẬT MỜ SINH LUẬT MỜ VỚI NGỮ
NGHĨA DỰA TRÊN ĐẠI SỐ GIA TỬ ÁP DỤNG LỰA CHỌN ĐẶC TRƯNG
Với mục tiêu làm giảm số chiều của các tập dữ liệu có số chiều lớn trước khi thực hiện
sinh luật sử dụng ĐSGT, luận án đề xuất ứng dụng kỹ thuật lựa chọn đặc trưng với trọng
số động do Sun X. đề xuất năm 2013 như một bước tiền xử lý bổ sung cho phương pháp
hai bước thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ trên cơ sở ĐSGT.
4.2.1. Một số khái niệm cơ bản về lý thuyết thông tin
4.2.2. Kỹ thuật lựa chọn đặc trưng sử dụng trọng số động
Công thức phân tích tính hợp lý: ( , ) = 2 ×

( ; )
( )

( )

Đầu vào: Tập dữ liệu huấn luyện D với không gian thuộc tính F và lớp C.
Đầu ra: Tập con S được lựa chọn có thuộc tính.

Begin
Khởi tạo các biến: k = 1, = ∅; Khởi tạo trọng số w(f) cho từng thuộc tính f trong F bằng 1;
Tính giá trị U(f, class) cho từng thuộc tính f trong F;
While ≤ do
For từng thuộc tính ứng viên ∈ do
Tính ( ) = ( ,
) × ( );
End;
Chọn thuộc tính ứng viên fj có J(f) lớn nhất; = ∪ { }; F = F \ {fj};
For từng thuộc tính ứng viên ∈ do
Tính tỷ lệ phụ thuộc lẫn nhau CR(i, j); ( ) = ( ) × (1 + ( , ));
End; k = k + 1;

End.
Độ phức tạp của giải thuật DWFS là ( × ) như đã được chứng minh bởi Sun X.,
trong đó, n là số thuộc tính gốc và số thuộc tính được lựa chọn.
4.2.3. Ứng dụng giải thuật DWFS trong thiết kế FLRBC trên cơ sở ĐSGT
Phương pháp hai giai đoạn thiết kế FLRBC theo tiếp cận ĐSGT được bổ sung thêm
một giai đoạn tiền xử lý áp dụng giải thuật DWFS. Bước tiền xử lý như sau: Với mỗi tập
dữ liệu cụ thể, các thuộc tính có giá trị liên tục được phân hoạch thành các cụm bằng việc
áp dụng kỹ thuật phân cụm mờ c-means với hàm chỉ số hợp lệ cụm (cluster validity index
function) PBMF để rời rạc hóa dữ liệu và sau đó áp dụng giải thuật DWFS để lựa chọn
một tập con các thuộc tính có tính phân biệt nhất.
4.2.4. Kết quả thực nghiệm và thảo luận
Sau khi áp dụng kỹ thuật lựa chọn đặc trưng, thời gian sinh luật giảm đáng kể. Chẳng
hạn, thời gian sinh tập luật khởi đầu từ tập dữ liệu Dermatology gốc trong trường hợp độ
dài luật tối đa là 3 hết 07:41:03 hay 27.663 giây, lớn hơn 5.532 lần so với sau khi áp dụng

: ⟶
với Intv là tập các khoảng trên miền giá trị số được chuẩn hóa của X biểu thị
ngữ nghĩa khoảng của các từ của phải bảo toàn tính khái quát và tính cụ thể của các từ.
Cụ thể, hai từ x và hx ∈ với h là một gia tử, quan hệ (ℎ ) ⊆ ( ) phải được thỏa.
Ràng buộc thứ tư. Để bảo toàn ngữ nghĩa của các luật ngôn ngữ, các phép gán ngữ nghĩa
tính toán của các từ ngôn ngữ của một biến X xuất hiện trong các luật phải bảo toàn thứ tự
ngữ nghĩa của các từ của X.
Cấu trúc phân hoạch mờ đơn thể hạt không thỏa Ràng buộc thứ ba, tức (ℎ ) ⊈
( ), do độ hỗ trợ của tập mờ ứng với từ ngôn ngữ x không chứa độ hỗ trợ của từ ngôn
ngữ hx được cảm sinh từ x nhờ gia tử h.
Với cấu trúc phân hoạch mờ đa thể hạt dựa trên độ dài của các từ, độ hỗ trợ của từ x
không chứa độ hỗ trợ của các từ hx, do đó phân hoạch được tạo ra không thỏa Ràng buộc
thứ ba nêu trên. Để thỏa Ràng buộc thứ ba, N. C. Hồ và các cộng sự đề xuất tách các từ
ngôn ngữ có độ dài bằng 1 tại mức k = 1 thành hai mức: mức k = 0 chỉ bao gồm 3 từ ngôn
ngữ 00, W và 10, mức k = 1 bao gồm 4 từ ngôn ngữ 01, c-, c+ và 11. Với cách biểu diễn này,
độ hỗ trợ của tập mờ ứng với từ ngôn ngữ x hoàn toàn chứa độ hỗ trợ của từ ngôn ngữ hx
và Ràng buộc thứ ba, tức (ℎ ) ⊆ ( ) và kết quả là thỏa cả bốn ràng buộc nêu trên.
Các kết quả thực nghiệm cho thấy, hệ phân lớp với cấu trúc đa thể hạt mới có hiệu suất
phân lớp trên tập kiểm tra tốt hơn so với hệ phân lớp với cấu trúc đa thể hạt cũ đối với 18
tập dữ liệu mẫu trong số 23 tập dữ liệu mẫu được thử nghiệm. Các kết quả kiểm định giả
thuyết thống kê Wilcoxon Signed Rank cho ta kết luận, phương pháp thiết kế đa thể hạt
với mức k = 1 được tách thành hai mức 0 và 1 như được trình bày ở trên không những có
ngữ nghĩa dựa trên tập mờ hình thang của các từ ngôn ngữ thỏa Ràng buộc thứ ba và đảm
bảo tính giải nghĩa được của khung ngôn nhận thức ngôn ngữ, mà còn cho hiệu suất phân
lớp tốt hơn so với phương pháp thiết kế đa thể hạt không tách mức k = 1.
23

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ - Pdf 37

Tài liệu, ebook tham khảo khác

Học thêm