xây dựng hệ luật mờ mamdani từ cơ sở dữ liệu số - Pdf 24

i
S húa bi Trung tõm Hc liu đại học thái nguyên
Tr-ờng đại học CÔNG NGHệ THÔNG TIN Và TRUYềN THÔNG

O TH MINH HON
XY DNG H LUT M MAMDANI
T C S D LIU S Chuyờn ngnh: KHOA HC MY TNH
Mó s : 60.48.01 LUN VN THC S KHOA HC MY TNH
THI NGUYấN - 2014

ii
Số hóa bởi Trung tâm Học liệu LỜI CAM ĐOAN

iii
Số hóa bởi Trung tâm Học liệu LỜI CẢM ƠN
Lời đầu tiên cho phép tôi bày tỏ lòng biết ơn sâu sắc tới TS. Trần Thái
Sơn – Viện Công Nghệ Thông Tin – Viện Hàn Lâm Khoa Học và Công Nghệ Việt
Nam đã giúp đỡ và chỉ dẫn tận tình cho tôi về định hƣớng đề tài, hƣớng dẫn tôi
trong việc tiếp cận và khai thác các tài liệu tham khảo cũng nhƣ chỉ bảo cho tôi
trong quá trình tôi viết luận văn và hoàn thành luận văn.
Tôi xin chân thành cảm ơn Ban giám hiệu, Khoa sau đại học trƣờng Đại
học Công Nghệ Thông Tin và Truyền Thông Thái Nguyên đã tạo mọi điều kiện
giúp tôi nghiên cứu và hoàn thành luận văn này.
Do điều kiện thời gian và phạm vi nghiên cứu có hạn, luận văn không
tránh khỏi những thiếu sót, tác giả luận văn kính mong nhận đƣợc sự chỉ dẫn và
góp ý thêm của các thầy giáo, cô giáo và các anh chị học viên để luận văn trở nên
hoàn thiện hơn.
Tác giả

Đào Thị Minh Hoàn

2.1.1. Chuyển đổi CSDL số sang CSDL mờ: mục đích và phƣơng pháp giải. 24
2.1.2. Bài toán hồi quy mờ 24
2.2. Xây dựng hệ luật mờ từ CSDL - nhóm giải pháp 2 giai doạn. 28
2.3. Xây dựng hệ luật mờ từ CSDL – nhóm giải pháp 1 giai doạn. 36
Chƣơng 3:CHƢƠNG TRÌNH THỬ NGHIỆM 38

v
Số hóa bởi Trung tâm Học liệu 3.1. Đặt bài toán 38
3.2. Tìm kiếm hệ luật tối ƣu dựa trên giải thuật di truyền lai 39
3.3. Chƣơng trình 44
3.3.1. Cài đặt chƣơng trình 44
3.3.2. Giao diện của chƣơng trình 44
KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54 vi
Số hóa bởi Trung tâm Học liệu DANH MỤC CÁC HÌNH Hình 1.1: Đồ thị biểu diễn hàm thuộc của tập mờ già (old) 6

Cơ sở dữ liệu
GA
Giải thuật di truyền
MF
Hàm thuộc
FB
CSDL mờ
SGA
Thuật toán di truyền lai

1
Số hóa bởi Trung tâm Học liệu

MỞ ĐẦU
Khai phá dữ liệu, rộng hơn là khai phá tri thức đã và đang thu hút sự chú ý
mạnh mẽ của các nhà nghiên cứu trên thế giới và ở Việt Nam. Do sự bùng nổ
thông tin trong mọi lĩnh vực của đời sống, đòi hỏi phải có những phƣơng pháp
khoa học và công nghệ để khai thác có hiệu quả từ khối lƣợng thông tin khổng lồ
những tri thức cần thiết giúp cho con ngƣời hoạch định những chiến lƣợc, chính
sách cho xã hội. Hồi quy (regression), một trong những hƣớng nghiên cứu chính
trong khai phá dữ liệu, có nhiệm vụ từ những tập dữ liệu mẫu rút ra các quy luật
để dự báo mô hình và kết quả có thể xẩy ra trong dữ liệu tƣơng lai. Hồi quy toán
học đã phát triển từ khá lâu và cũng đạt đƣợc nhiều kết quả tốt đẹp, tuy nhiên so
với yêu cầu thực tế thì vẫn còn nhiều việc phải làm, nhƣ tăng tính chính xác của
mô hình, giảm thời gian tính toán đến mức tối thiểu, nghiên cứu các mối tƣơng
quan nhiều biến phức tạp Với sự phát triển mạnh mẽ của công nghệ thông tin,
gần đây nhiều hƣớng nghiên cứu mới giải bài toán hồi quy đã ra đời, trong đó có
hƣớng nghiên cứu hồi quy mờ dựa trên hệ luật mờ đặc biệt đƣợc quan tâm do
tính hiệu quả kết hợp với độ chính xác khá cao của thuật toán, đáp ứng nhu cầu
khai thác dữ liệu mờ hiện nay. Hệ luật mờ Mamdani (MFRBS) bao gồm M luật

Số hóa bởi Trung tâm Học liệu

mặt trong không gian M+1 chiều, cho phép với đầu vào là một vecto M chiều các
giá trị thực (hoặc ngôn ngữ) có thể suy ra giá trị đầu ra (giá trị số). Luận văn có
nhiệm vụ nghiên cứu tổng hợp và đề xuất giải pháp xây dựng một hệ luật mờ
Mamdani ứng dụng vào giải quyết bài toán hồi quy mờ trong thực tế.
Về bố cục, luận văn gồm phần mở đầu, 3 chƣơng, phần kết luận và tài liệu
tham khảo.
Phần mở đầu nêu mục đích yêu cầu và cách tiếp cận giải bài toán hồi quy
mờ thông qua hệ luật mờ Mandani theo cách tiếp cận lý thuyết tập mờ.
Chƣơng 1: Tập mờ và giải thuật di truyền
Trong chƣơng này trình bày các kiến thức cơ bản về tập mờ và giải thuật di
truyền.
Chƣơng 2: Giải bài toán xây dựng hệ luật mờ theo cách tiếp cận của lý
thuyết tập mờ. Ứng dụng vào bài toán hồi quy mờ
Đề xuất cách xây dựng hệ luật mờ Mandani và sử dụng hệ luật mờ này giải
quyết bài toán hồi quy mờ.
Chƣơng 3: Chƣơng trình thử nghiệm
Trình bày chƣơng trình thử nghiệm minh họa cho cách tiếp cận lý thuyết
tập mờ trong việc giải bài toán hồi quy mờ.
3

(x) mà nó liên
kết mỗi phần tử xU với một số thực trong đoạn [0,1]. Giá trị hàm

A
(x) biểu

4
Số hóa bởi Trung tâm Học liệu

diễn mức độ thuộc của x trong A.

A
(x) là một ánh xạ từ U vào [0,1] và đƣợc gọi
là hàm thuộc của tập mờ A.
Nhƣ vậy, giá trị hàm

A
(x) càng gần tới 1 thì mức độ thuộc của x trong A
càng cao. Khi A là một tập hợp kinh điển, hàm thuộc của nó,

A
(x), chỉ nhận 2
giá trị 1 hoặc 0, tƣơng ứng với x có nằm trong A hay không. Rõ ràng, tập mờ là
sự mở rộng của khái niệm tập hợp kinh điển. Các khái niệm, phép toán trong lý
thuyết tập kinh điển cũng đƣợc mở rộng cho các tập mờ.
Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào
đoạn [0,1], tức là
( ,[0,1])UF
= {


)/u
n
= 
1i n

A
(u
i
)/u
i

- Trƣờng hợp U vô hạn đếm đƣợc, U={u
i
: i=1,2,… }, ta viết
A = 
1i <

A
(u
i
)/u
i

- Trƣờng hợp U vô hạn liên tục, U=[a,b], ta viết
A =
( ) /
b
A
a
uu

thuộc

A
(u) trên U, tức là high(A) = sup{

A
(u) : uU}.
iii) A đƣợc gọi là tập mờ chuẩn nếu high(A)=1. Ngƣợc lại gọi là tập
mờ dƣới chuẩn.
iv) Lõi của tập mờ A, ký hiệu core(A), là một tập con của U đƣợc xác
định nhƣ sau:
core(A) = {uU:

A
(u) = high(A)}.
Định nghĩa 1.4. Cho một tập mờ A trên tập vũ trụ U,
i) Lực lƣợng vô hƣớng hay bản số của tập mờ A, ký hiệu count(A),
đƣợc xác định là:
count(A) = 
uU

A
(u), nếu U là hữu hạn hay đếm đƣợc,
= 
U

A
(u)du, nếu U là vô hạn liên tục.
ii) Lực lƣợng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là
một tập mờ trên tập các số nguyên không âm N, đƣợc xác định nhƣ sau:

u
u
u
u












Khi đó tập mức =0.5 của A là A
0.5
= {u : 66 u 120} ; support(A) = {u :
61u120} ; high(A) = 1.01
-1
; core(A) = {120}.

6
Số hóa bởi Trung tâm Học liệu
Hình 1.1: Đồ thị biểu diễn hàm thuộc của tập mờ già (old)
Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các

B
(u)), uU,

A~
(u) = 1-

A
(u), uU.
Hay viết ở dạng thu gọn là

AB
(u) =

A
(u)

B
(u)),

A

B
(u) =

A
(u) 

B
(u)).
Ví dụ 1.2. Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị trong

1.0
0.9
0.8
0.6
0.4
0.2
0.0
0.0
0.0
0.0

7
Số hóa bởi Trung tâm Học liệu

Ta có kết quả của các phép toán trên hai tập mờ này với hàm thuộc thể hiện
trong bảng sau:
uU
1
2
3
4
5
6
7
8
9
10

GK
(u)

0.7
0.5
0.3
0.1
0.0
0.0
Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ
trên không gian tích Đề-các các miền cơ sở. Nhƣ tên gọi, quan hệ mờ mô tả mối
quan hệ mờ giữa các đối tƣợng trong miền cơ sở. Về mặt hình thức chúng ta định
nghĩa quan hệ mờ nhƣ sau.
Định nghĩa 1.6. Cho U là tích Đề-các của n miền cơ sở U
i
, i=1, ,…, n. Khi
đó mỗi một tập mờ trên U đƣợc gọi là một quan hệ mờ n-ngôi và đƣợc kí hiệu là
R, gọi là tên của quan hệ đó, và nó đƣợc biểu thị bằng công thức sau:
1
1 1 1 1

( , , ) / ( , , )
n
UU
R u u u u





Trong đó

(u

, u
2
, u
3
}, V = {v
1
, v
2
} và W = {w
1
, w
2
}, với quan hệ
mờ R trên UV và S trên VW đƣợc cho hàm thuộc dƣới dạng ma trận
12
1
2
3
0.4 1
1 0.3
0.7 0.8
vv
u
Ru
u











,
và max-product là
12
1
2
3
0.8 0.32
0.21 0.8
0.56 0.56
ww
u
R S u
u







.
Phép hợp thành các quan hệ mờ đóng vai trò quan trọng trong quá trình lập
luận xấp xỉ sau này. Trong hầu hết các ứng dụng, tri thức đƣợc biểu diễn dƣới
dạng luật “if-then” và mỗi luật đƣợc xem nhƣ một quan hệ mờ
Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ

các giá trị ngôn ngữ. Thứ hai là quy tắc ngữ nghĩa, qui định thủ tục tính toán ngữ
nghĩa của các giá trị ngôn ngữ. Ngoài các giá trị sinh nguyên thủy, các giá trị
ngôn ngữ có thể gồm các từ liên kết nhƣ and, or, not,… và các gia tử ngôn ngữ
nhƣ very, possible, less, quite, more,….
Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên
thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai khác
nhau bởi giá trị sinh nguyên thủy này. Đây gọi là tính phổ quát của biến ngôn
ngữ.
Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ
cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ cảnh.
Đây là tính độc lập ngữ cảnh của gia tử và liên kết.
1.1.4. Lôgic mờ
Cùng với khái niệm biến ngôn ngữ, L. A. Zadeh đã phát triển lôgic mờ mà
các giá trị chân lý nhận trong T(Truth) = {true, very true, more false, possible
false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth. Khi đó, một
mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị chân lý thuộc
T(Truth) và đƣợc biểu thị bởi một tập mờ có hàm thuộc

A
trên không gian tham
chiếu U.
Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phƣơng pháp mô
phỏng lập luận của con ngƣời. Về nguyên tắc, vấn đề tƣ duy, lập luận của con

10
Số hóa bởi Trung tâm Học liệu

ngƣời rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy nhất để
mô phỏng. Vì vậy, mục tiêu của chúng ta là càng xây dựng đƣợc nhiều cấu trúc
đại số các tập mờ càng tốt để linh hoạt trọng tiếp cận các vần đề ứng dụng. Ở

 [0,1],
bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở trên.
Định nghĩa 1.11. Hàm N: [0,1]  [0,1] đƣợc gọi là phép phủ định
(negation) nếu nó thỏa các tính chất sau với a,a’ [0,1]:

11
Số hóa bởi Trung tâm Học liệu

i) Tính đơn điệu giảm: a a’ N(a) N(a’)
iv) Tính lũy đẳng: N(N(a)) = a
Ví dụ 1.5. Các phép t-norm, t-conorm và phép phủ định hay đƣợc sử dụng nhƣ:
T
M
(a,b) = min{a,b}
T
P
(a,b) = a.b
T
L
(a,b) = max{0,a+b-1}

*
khi 1
( , ) khi 1
0 khi 1& 1
ab
T a b b a
ab






N(a) = 1-a.
Định nghĩa 1.12. Ba phép tính t-normT, t-conorm S và phép phủ định N
đƣợc gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:
N(S(a,b)) = T(N(a),N(b)), a,b[0,1].
Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc tính
toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm dẻo
trong ứng dụng. Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị chân lý
đƣợc biểu thị bởi hai hàm thuộc tƣơng ứng

A
và

B
trên không gian tham chiếu
U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá trị chân lý là

AB
= T(

A
,

B
), với T là một t-norm nào đó. Tƣơng tự, mệnh đề “X is A or B” có
hàm thuộc là

AB

ii) Tính đơn điệu tăng đối với biến thứ hai
y uI(x,y)  I(x,u), x[0,1]
iii) Tính chi phối của giá trị chân lý sai
I(0,x) = 1
iv) Tính trung tính của giá trị chân lý đúng
I(1,x) = x
v) Tính đồng nhất
I(x,x) = x
vi) Tính chất hoán đổi
I(x,I(y,z)) = I(y,I(x,z))
vii) Tính chất về điều kiện giới nội
I(x,y) = 1 nếu và chỉ nếu x y
viii) Tính chất khái quát hóa của phép kéo theo kinh điển
I(x,y) = I(N(y),N(x)), trong đó N là phép phủ định
ix) I là hàm liên tục theo cả hai biến.
Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối quan
hệ giữa hai khái niệm mờ A và B. Vì vậy, chúng cảm sinh một quan hệ mờ R thể
hiện bởi một tập mờ trên không gian tích Đề-các UV đƣợc xác định bởi hàm
thuộc thông qua một phép kéo theo đƣợc chọn.
Ví dụ 1.6. Một số dạng phép kéo theo thƣờng dùng
 Mamdani

13
Số hóa bởi Trung tâm Học liệu

I(x,y) = min{x,y}
 Dạng khái quát từ phép kéo theo kinh điển
I(x,y) = S(N(x),y), hoặc
I(x,y) = S(N(x),T(x,y)), hoặc
I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép t-

cuối cùng chứng minh tính phù hợp của một định nghĩa phép kéo theo mờ.
1.1.5. Lập luận xấp xỉ
Trong nghiên cứu của mình, L. A. Zadeh lần đầu đề xuất khái niệm lập luận
xấp xỉ phỏng theo cách lập luận của con ngƣời. Nó là quá trình tìm kiếm kết luận

14
Số hóa bởi Trung tâm Học liệu

từ một tập các tri thức dạng luật (biểu diễn bằng mệnh đề có điều kiện) và các sự
kiện, dựa trên lý thuyết tập mờ. Đặc trƣng của lập luận xấp xỉ là yếu tố không
chắc chắn, gần đúng và tính không duy nhất của kết quả thu đƣợc. Rõ ràng, tri
thức càng đầy đủ thì kết luận càng phù hợp với thực tiễn hơn.
Các quy tắc suy diễn trong lôgíc mờ dùng cho việc lập luận xấp xỉ đƣợc mở
rộng từ các quy tắc trong lôgic kinh điển nhƣ modus ponens, modus tollens, tam
đoạn luận (syllogism),…
Ở đây chúng ta xét trƣờng hợp lập luận mờ đa điều kiện, tức là phƣơng
pháp lập luận dựa vào nhiều luật, đƣợc áp dụng rộng rãi trong ứng dụng thực
tiễn. Hơn nữa, mỗi luật bao gồm nhiều biến ngôn ngữ tham gia trong phần tiền tố
và liên kết lôgíc với nhau bằng phép AND. Đây đƣợc gọi là mô hình lập luận mờ
nhiều đầu vào một đầu ra (MISO).
Phƣơng pháp này đƣợc mô tả bằng sơ đồ sau:
Tiền đề 1 : If X
1
is A
1,1
AND…AND X
N
is A
1,N
then Y is B

N
is A
N
’


Kết luận : Y is B’
Trong đó X
1
, X
2
,…, X
n
và Y là các biến ngôn ngữ, N là số biến vào và M là
số luật mờ, A
i,j
(i=1,…,M và j=1,…,N) là các tập mờ trên không gian nền U
1
,
U
2
,…,U
n
và V tƣơng ứng. Tìm đƣợc tập mờ B’ có nghĩa là chúng ta đã lập luận từ
sự kiện X
1
is A
1
’ AND … AND X
N

i,1
… A
i,n
 B
i
,
trong đó,  là phép hợp của các tập mờ và  là phép kéo theo mờ. Áp dụng một
toán tử t-norm T
ex
mở rộng cho phép hội  và một phép kéo theo I nào đó, ta có
hàm thuộc của quan hệ mờ trên là
,
,1
( ( , , ), )
ii
iN
i
ex
RB
AA
IT
   

(1.1)
Mô hình mờ ở đây đƣợc coi là tuyển của các luật, do vậy áp dụng phép hội
để kết nhập các quan hệ mờ R
i
ở trên bằng toán tử t-conorm S
ex
mở rộng nhƣ sau:

''
1
11
' 1 1
( , , )
( ) sup ( ( ), , ( )) ( , , , )
N
NN
ex
N R N
B
AA
u u U U
v T u u u u v
   
  
 
(1.3)
Từ các công thức (1.1), (1.2) và (1.3) viết dạng thu gọn của hàm thuộc tập
mờ B’ nhƣ sau:
 
 
'
,
11
1 1 1
, , )
'
(
( ) ( ( ), ( ))( ) sup

max .

16
Số hóa bởi Trung tâm Học liệu

Rõ ràng, trong công thức (1.4) với nhiều cách chọn các phép t-norm, t-
conorm và negation cũng nhƣ phép kéo theo I do vậy có nhiều cách xác định
hàm thuộc của tập mờ B’, dẫn đến kết quả lập luận cũng khác nhau. Điều này
phù hợp với đặc trƣng của lập luận xấp xỉ. Cách chọn các phép trên nhƣ thế nào
để có một phƣơng pháp lập luận tốt. Nói chung không có câu trả lời khẳng định
mà phụ thuộc vào từng tình huống ứng dụng cụ thể và đƣợc kiểm chứng qua kết
quả thực nghiệm.
Công thức (1.4) cũng cho thấy một ánh xạ từ các tập mờ đến tập mờ thông
qua phƣơng pháp lập luận xấp xỉ trên, và đƣợc biểu diễn hình thức nhƣ sau:
B’ = F(A
1
’,…,A
N
’) (1.5)
Đặc biệt, các tác giả cho thấy rằng với những ràng buộc nhất định, hệ mờ
theo phƣơng pháp lập luận nhƣ trên đóng vai trò nhƣ một bộ xấp xỉ vạn năng.
Dựa trên định lý nổi tiếng của Stone-Weierstrass, Wang (1994) đã chứng tỏ đƣợc
khả năng xấp xỉ của hệ mờ bằng định lý sau.
Định lý 1.2. Với một hàm thực liên tục f trên tập compactU R
N
và bất kỳ

, luôn tồn tại một hệ lôgíc mờ F với phƣơng pháp giải mờ trọng tâm (COG),
phép suy diễn mờ dạng tích, hàm mờ hóa dạng đơn tử và hàm thuộc của tập mờ
dạng Gauss thỏa mãn,

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

xây dựng hệ luật mờ mamdani từ cơ sở dữ liệu số - Pdf 24

Tài liệu, ebook tham khảo khác

Học thêm