i
LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả nêu trong luận văn là những kết quả tìm
hiểu, nghiên cứu của tôi dưới sự hướng dẫn của Thầy giáo PGS.TS: Nguyễn Tân
Ân. Mọi trích dẫn sử dụng trong báo cáo này đều được ghi rõ nguồn tài liệu
tham khảo theo đúng quy định.
Vũ Thị Lành
ii
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................... i
MỤC LỤC ......................................................................................................... ii
LỜI CẢM ƠN ................................................................................................... iv
DANH MỤC HÌNH ........................................................................................... v
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG I: TẬP MỜ VÀ TẬP MỜ TRỰC CẢM............................................ 3
1.1. Tập mờ ..................................................................................................... 3
1.1.1. Định nghĩa tập mờ ............................................................................. 4
1.1.2. Các phép toán trên tập mờ ................................................................. 4
1.1.3. Khoảng cách giữa các tập mờ .......................................................... 10
1.2. Tập mờ trực cảm ( Intuitionistic Fuzzy Sets - IFSs) ............................... 11
1.2.1. Định nghĩa tập mờ trực cảm ............................................................. 11
1.2.2. Một số phép toán trên tập mờ trực cảm hình thang......................... 11
1.2.3.Các phép toán trên số mờ trực cảm hình thang, hình tam giác .......... 13
Kết luận chương 1: ........................................................................................... 14
CHƯƠNG II. ĐỘ TƯƠNG TỰ GIỮA CÁC TẬP MỜ TRỰC CẢM ............... 16
2.1. Khoảng cách giữa các tập mờ trực cảm .................................................. 16
2.1.1 Khoảng cách S C ( A, B ) ...................................................................... 16
Trước hết, tôi xin chân thành cảm ơn các Thầy cô Trường Đại học Công
nghệ Thông tin & Truyền thông, đặc biệt là các Thầy cô đã tận tình giảng dạy
tôi trong suốt quá trình học tập tại trường.
Tôi xin gửi lời biết ơn sâu sắc đến Thầy giáo PGS.TS Nguyễn Tân Ân,
Thầy hướng dẫn, đã dành nhiều thời gian và tâm huyết hướng dẫn tôi nghiên
cứu trong suốt thời gian qua.
Tôi cũng xin chân thành cảm ơn đồng nghiệp trong nhóm tin Trường Đại
học Hoa Lư đã tạo điều kiện về mặt thời gian để tôi có thể hoàn thành chương
trình học và bảo vệ Luận văn Tốt nghiệp.
Cuối cùng, tôi xin gửi lời cảm ơn tới những người thân trong gia đình tôi,
bạn bè tôi đã luôn động viên, khích lệ tôi trong quá trình học tập và nghiên cứu.
Mặc dù tôi đã có nhiều cố gắng hoàn thành luận văn một cách tốt nhất, tuy
nhiên do năng lực còn nhiều hạn chế nên không thể tránh khỏi những thiếu sót.
Vì vậy, tôi rất mong nhận được những đóng góp quý báu của thầy cô và các bạn.
Thái Nguyên, ngày 14 tháng 7 năm 2014
Học viên
Vũ Thị Lành
v
DANH MỤC HÌNH
Trang
Hình 1.1. Đồ thị biểu diễn hàm thuộc ................................................................. 5
Hình 1.2. Đồ thị biểu diễn phép giao .................................................................. 7
Hình 1.3. Đồ thị biểu diễn phép hợp ................................................................... 8
Hình 1.4: Số mờ trực cảm hình thang ............................................................... 14
Hình 1.5: Số mờ trực cảm tam giác .................................................................. 14
Atanassov đã đưa ra tập mờ trực cảm (intuitionistic fuzzy set), một mở rộng
của tập mờ Zadeh. Năm 1993 Gau & Buehrer cũng giới thiệu một loại tập mờ
mà các ông gọi là Vague set. Sau này người ta đã chỉ ra rằng intuitionistic
fuzzy set và Vague set chỉ là một (trong luận văn này chúng tôi dịch là tập
mờ trực cảm). Trong tập mờ trực cảm các tác giả đã dựa vào hai hàm thành
viên: Hàm thành viên đúng thể hiện mức độ thuộc của phần tử đang xét vào
tập mờ đã cho. Hàm thành viên sai thể hiện mức độ không thuộc của phần tử
đang xét vào tập mờ đã cho. Tập mờ của Zadeh trở thành trường hợp riêng
của tập mờ trực cảm. Với tập mờ trực cảm ta có thể biểu diễn các đối tượng
mờ một cách sát thực với bản chất của nó hơn.
Trong cơ sở dữ liệu mờ biểu diễn bằng tập mờ trực cảm, xác định độ
tương tự giữa các phần tử đòi hỏi cách làm khác. Càng tính được độ tương tự
giữa các phần tử phản ánh đúng bản chất của sự giống nhau, ta có các kết quả
truy vấn, kết quả tìm kiếm và các qui luật trong dữ liệu càng đúng đắn.
Trong khuôn khổ của một luận văn thạc sỹ, tôi chọn đề tài “Một số độ
đo mức tương tự giữa các tập mờ trực cảm (Vague sets), thử nghiệm
2
trong phân cụm dữ liệu” tìm hiểu về các độ đo mức tương tự giữa các tập
mờ trực cảm, ứng dụng trong phân cụm dữ liệu độ đo mức tương tự và lý
thuyết tập mờ, ứng dụng tập mờ để biểu diễn thông tin.
2. Đối tượng và phạm vi nghiên cứu
- Lý thuyết về tập mờ và tập mờ trực cảm trực cảm.
- Các độ đo mức tương tự giữa các tập mờ trực cảm và ứng dụng trong
phân cụm dữ liệu.
- Nghiên cứu lý thuyết và ứng dụng của tập mờ, tập mờ trực cảm.
- Nghiên cứu về độ tương tự giữa các tập mờ trực cảm.
- Thử nghiệm một số độ đo mức tương tự khi phân cụm dữ liệu.
Ý tưởng cơ bản của tập mờ xuất phát từ những khái niệm trừu tượng về
ngữ nghĩa của thông tin không chắc chắn như: trẻ, xinh, cao, tốt,… Khi nói
đến khái niệm tập hợp thường là những phần tử có cùng một số tính chất
chung nào đó, ví dụ như tập các sinh viên. Ta có:
S = {s | s là sinh viên}
Vậy nếu một người nào đó là sinh viên thì thuộc tập S, ngược lại thì
không thuộc tập S. Tuy nhiên, trong thực tế có rất nhiều trường hợp mà khái
niệm không được định nghĩa một cách rõ ràng. Ví dụ, khi nhận xét về một
người: “người này trẻ” thì khi đó sẽ có một câu hỏi: “như thế nào là trẻ?”,
hoặc có những ví dụ khác như: “lớp những chiếc xe đẹp”, “lớp những người
cao”,… Khi đó những khái niệm trên được gọi là những khái niệm mờ, đó là
những khái niệm không được định nghĩa một cách rõ ràng. Những tập hợp
dạng này đã được Zadeh biểu diễn bằng một khái niệm toán học được gọi là
tập mờ và được coi như là một trường hợp riêng được khái quát từ khái niệm
tập hợp kinh điển. [8]
Xét lại ví dụ trên, ta sẽ đi biểu diễn ngữ nghĩa của khái niệm “trẻ” trong
việc đánh giá về một người. Giả sử tuổi của con người được biểu diễn trong
đoạn từ [0, 140] tính theo đơn vị năm. Theo Zadeh, khái niệm “trẻ” có thể
biểu diễn như sau: Xét tập hợp Atrẻ là những người được đánh giá là trẻ. Ông
4
đưa ra một câu hỏi cần trả lời “Một người có tuổi x được hiểu là thuộc tập Atrẻ
như thế nào?”. Thông thường ta có thể thấy những người có tuổi từ 0-25 sẽ
thuộc vào tập Atrẻ tức là độ thuộc bằng 1; nhưng với người có tuổi là 26 thì có
lẽ chỉ thuộc vào tập Acao với độ thuộc 0.3, còn người có tuổi 40 sẽ thuộc vào
tập Atrẻ với độ thuộc 0,… Từ đó ông đưa ra, ngữ nghĩa của khái niệm trẻ sẽ
được biểu diễn bằng một hàm số trÎ : U [0, 1] .
1.1.1. Định nghĩa tập mờ
hàm thuộc như sau: trÎ (1) 1, trÎ (15) 1, trÎ (20) 1, trÎ (30) 0.1, trÎ (50) 0
và tập mờ AtrÎ 0,1 , 15,1 , 20,1 , 30,0.1 , 50,0 .
1.1.2. Các phép toán trên tập mờ
Để có thể tiến hành mô hình hóa các hệ thống có chứa tập mờ và biểu
diễn các quy luật vận hành của hệ thống này trước tiên ta cần tới việc suy
rộng các phép toán logic cơ bản với các mệnh đề có chân trị trên đoạn [0,1].
Cho Ω = {P1, P2,...} với P1, P2,... là các mệnh đề. Tập mờ A trên Ω
tương ứng với ánh xạ v như sau:
v: Ω → [0,1]
Pi Ω → v(Pi)
Ta gọi v(Pi) là chân trị của mệnh đề Pi trên [0,1].
5
1.1.2.1. Phép phủ định mờ
Định nghĩa 1:
Hàm n: [0,1] → [0,1] không tăng thỏa mãn các điều kiện n(0) = 1, n (1) = 0
và thỏa 4 điều kiện:
- v(NOT P) chỉ phụ thuộc vào v(P).
- Nếu v(P) = 1 thì v(NOT P) = 0
- Nếu v(P) = 0 thì v(NOT P) = 1
- Nếu v(P1) ≤ v(P2) thì v(NOT P1) ≥ v(NOT P2)
được gọi là hàm phủ định.
Ví dụ: n(x) = 1 - x hay n(x) = 1 - x2 là các hàm phủ định.
Dễ thấy rằng các hàm đó thỏa các điều kiện của định nghĩa trên.
Định nghĩa 2 (Phần bù của một tập mờ):
Cho n là hàm phủ định, phần bù Ac của tập mờ A là một tập mờ với
hàm thuộc về được xác định bởi:
μAc (a) = n(μA(a)), với mỗi a Ω.
- T không giảm theo nghĩa: T(x,y) ≤ T(u,v), với mọi x ≤ u, y ≤ v.
- T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),x), với mọi 0 ≤ x, y, z ≤1.
Từ các tính chất trên có thể suy ra T(0,x) = 0.
Dễ thấy T(x,y) = min(x,y) thỏa các điều kiện trên.
Định nghĩa 6 (Giao của hai tập mờ):
Cho hai tập mờ A, B trên cùng không gian nền Ω với hàm thuộc μA(a),
μB(a) và cho T là một phép hội.
Ứng với phép hội T, giao của hai tập mờ A, B là một tập mờ trên Ω với
hàm thuộc cho bởi:
μA∩B(a) = T(μA(a), μB(a)) a Ω
Ví dụ:
Với T(x,y) = min(x,y) ta có:
μA∩B(a) = min(μA(a), μB(a))
7
Với T(x,y) = x.y ta có:
μA∩B(a) = μA(a).μB(a) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm
T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị sau đây:
b
a
c
Hình 1.2. Đồ thị biểu diễn phép giao
- Hình a: Hàm thuộc của hai tập mờ A và B
(1,0)
(2,0.5)
(3,0.7)
(4,0.2)
(5,0.4)
AB
(1,0)
(2,0.5)
(3,0.5)
(4,0.2)
(5,0.2)
1.1.2.3. Phép tuyển mờ
Định nghĩa 7 (Phép tuyển mờ):
Hàm S: [0,1]2 → [0,1] được gọi là phép tuyển mờ nếu S thỏa các điều
kiện sau:
- S(0, x) = x, với mọi 0≤ x ≤1.
9
- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y - x.y
Ví dụ:
Cho Ω, S(x,y) = max(x,y) và A, B là các tập mờ, phép hợp của hai tập
mờ được tính và cho trong bảng sau:
Ω
1
2
3
4
5
A
(1,0)
(2,1)
(3,0.5)
(4,0.3)
(2,1)
(3,0.5)
(4,0.7)
(5,0.8)
1.1.2.4. Phép kéo theo
Định nghĩa 9:
Phép kéo theo của một hàm số I: [0,1]2 → [0,1] thỏa các điều kiện sau:
- Nếu x ≤ z thì I(x,y) ≥ I(z,y), y [0,1].
- Nếu y ≤ u thì I(x,y) ≤ I(z,y), x [0,1].
- I(0,x) = 1, x [0,1].
- I(x,1) = 1, x [0,1].
- I(1,0) = 0
1.1.2.5. Hệ thống suy luận mờ
Suy diễn mờ là quá trình suy ra những kết luận dưới dạng các mệnh đề
mờ trong điều kiện của quy tắc "Nếu... Thì...", với các dữ liệu đầu vào cho
trước là không được rõ ràng.
Thông thường, suy diễn mờ hay sử dụng luật Modus Ponnens hoặc
Modus Tollen.
Trong logic rõ, Modus Ponnen diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức): P → Q
Mệnh đề 2 (sự kiện): P đúng
Kết luận: Q đúng
10
d(A,B) =
1 n
2
A x j B x j
n j 1
11
1.2. Tập mờ trực cảm ( Intuitionistic Fuzzy Sets - IFSs)
Trong cách định nghĩa tập mờ thông thường, chỉ sử dụng một hàm
thuộc để mô tả cho độ thuộc của một đối tượng vào một tập. Để tăng tính hiệu
quả cho việc mô tả các đối tượng người ta đã sử dụng thêm một hàm không
thuộc để biểu thị cho độ không thuộc vào một tập của một đối tượng. Tập mới
này được gọi là tập mờ trực cảm.
1.2.1. Định nghĩa tập mờ trực cảm
Cho U là tập vũ trụ khởi tạo, U u1 , u2 ,..., un . Một tập mờ trực cảm
trên U được xác định bởi hàm thành viên tv ( u ) chỉ mức độ thành viên của u
trong V và hàm không là thành viên f v chỉ mức độ không là thành viên của u
trong V, tv : U 0, 1 , fv : U 0, 1 . Tập mờ trực cảm V là:
V (u, tv (u ), f v (u )) | u U , tv (u ) [ 0, 1], f v (u ) [ 0, 1],0 tv (u ) f v (u ) 1
Thực chất tv ( ui ) là biên thấp nhất của mức độ thuộc của ui , f v ( ui ) là
biên thấp trên mức độ không thuộc của ui và tv ( ui ) f v ( ui ) 1 . Mức độ thành
viên của ui trong tập mờ trực cảm được bao bởi khoảng con
tv (ui ),1 fv (ui ) của 0, 1 . Giá trị mờ trực cảm tv (ui ),1 fv (ui )
chỉ ra mức
j 1
là phép toán trung bình số học có trọng số trên tập mờ trực cảm hình thang.
T
1 1
1
Đặc biệt, nếu , ,..., , IT-WAA là phép toán trung bình số học
n
n n
trên tập mờ trực cảm hình thang.
* Định lý 2.1. Cho a j ([ a j , b j , c j , d j ];a , a )( j 1,..., n) là một tập mờ
j
j
trực cảm hình thang, có:
n
n
n
n
IT WAA ( a1 , a 2 ,..., a n ) j a j , j b j , j c j , j d j ;
j 1
j 1
j 1
j 1
IT WGA ( a1 , a2 ,..., a n ) a j j
j 1
với là tập tất cả các tập mờ trực cảm hình thang, và (1 , 2 ,..., n ) T
n
là véc-tơ trọng số của a j ( j 1,..., n ) , j [0, 1], j 1 , thì IT-WGA được
j 1
gọi là phép toán trung bình hình học có trọng số.
13
T
1 1
1
Đặc biệt nếu , ,..., , IT-WGA là phép toán trung bình số học
n
n n
(IT-GA) trên tập mờ trực cảm hình thang.
* Định lý 2.2. Cho a j ([ a j , b j , c j , d j ]; a , a )( j 1,..., n ) là tập mờ trực
j
j
với (1 , 2 ,..., n ) T
là
véc-tơ
trọng
số
n
a j ( j 1,..., n), j [0, 1], j 1 . [1]
j 1
1.2.3.Các phép toán trên số mờ trực cảm hình thang, hình tam giác
Cộng:
[a,b] + [d,e] = [a+d, b+e]
Trừ:
[a,b] - [d,e] = [a-e, b-d]
Nhân:
[a,b] * [d,e] = [min(ad,ae, bd, be), max(ad,ae, bd, be)]
Chia:
[a,b] / [d,e] = [min(a/d,a/e, b/d, b/e), max(a/d,a/e, b/d, b/e)]
Số mờ hình thang
M(a,b,c,d)
của
0
z a
M z b a
c z
c b
0
za
a zb
bzc
cz
1
0
a
b c
Hình 1.5: Số mờ trực cảm tam giác
Kết luận chương 1:
Như vậy qua chương 1 luận văn đã trình bày cơ sở lý thuyết tập mờ,
các phép toán trên tập mờ, khoảng cách giữa các tập mờ. Phần tiếp theo trình
bày khái niệm tập mờ trực cảm, số mờ trực cảm và các phép toán trên số mờ
trực cảm.
S ( x ) 1,1 .
Cho
f x* 1 f x ,
chúng ta có thể thấy rằng
x t x ,1 f x t x , f x* . Trong trường hợp này, chúng ta có thể thấy
S ( x ) t x f x t x f x* 1
(8)
Cho X và Y là 2 giá trị trực cảm,
X t X ,1 f X t X , f X* và
Y tY ,1 fY tY , fY* . Mức độ tương tự giữa các giá trị trực cảm X và Y có thể
được đánh giá bởi hàm M.
M ( X ,Y ) 1
S ( X ) S (Y )
2
(9)
với S ( X ) t X f X t X f X* 1 và S (Y ) tY fY tY fY* 1 . Xem xét các
trường hợp dưới đây:
Trường hợp 1: Nếu các giá trị trực cảm X 1,1 và Y 0, 0 , ta có thể
0 1 1
2
2
(12)
Trường hợp 4: Nếu các giá trị trực cảm X 0,1 và Y 0,1 , ta có thể
thấy S ( X ) 1 và S (Y ) 1 . Áp dụng công thức (9), mức độ tương tự giữa các
giá trị trực cảm X và Y có thể được đánh giá và có kết quả là:
1
1 1
0
2
(13)
Rõ ràng là nếu X và Y các giá trị trực cảm giống hệt nhau (nghĩa là X=Y),
thì S ( X ) S (Y ) . Áp dụng công thức (9) ta có thể thấy rằng M ( X , Y ) 1 , nghĩa
là mức độ tương tự giữa tập mờ trực cảm X và Y là 1.
Cho A và B là 2 tập mờ trực cảm trong tập vũ trụ U, U u1 , u2 ,..., un , với
A t A (u1 ),1 f A (u1 ) / u1 t A (u2 ),1 f A (u2 ) / u2 t A (un ),1 f A (un ) / un
t A (u1 ), f A* (u1 ) / u1 t A (u2 ), f A* (u2 ) / u2 t A (un ), f A* (un ) / un
n
t A (ui ), f A* (ui ) / ui
i 1
S (VB (ui )) t B (ui ) f B* (ui ) 1
(17)
với 1 i n . Mức độ giống nhau giữa các tập trực cảm A và B có thể
đánh giá bởi hàm T,
T ( A, B)
1 n
M (VA (ui ),VB (ui ))
n i 1
S (VA (ui )) S (VB (ui ))
1 n
1
n i 1
2
(18)
với T ( A, B) 0,1 . Giá trị của T ( A, B ) càng lớn thì độ giống nhau giữa tập
trực cảm A và tập trực cảm B càng nhiều. [13]
Ví dụ 3.1. Cho A và B là 2 tập trực cảm của tập vũ trụ U.
U u1 , u2 , u3 , u4 , u5
A 0.2, 0.4 / u1 0.3, 0.5 / u2 0.5, 0.7 / u3 0.7, 0.9 / u4 0.8,1 / u5
S (VA (ui )) S (VB (ui ))
1 n
1
5 i 1
2
0.93
(19)
Nó chỉ ra rằng độ giống nhau giữa tập mờ trực cảm A và tập mờ trực
cảm B là 0.93.
2.1.2. Khoảng cách giữa S H và S L
* khoảng cách SH
Năm 1999, Hong và Kim, năm 2001, Fan và Zhangyan đã giới thiệu một
độ đo mới là S H và SL nhằm khắc phục những vấn đề của độ đo SC . Độ đo
S H được xác định như sau:
20
n
t
s H ( A, B )
tA ( xi ) tB ( xi ) ,
tC ( xi ) tD ( xi ) ,
f A ( xi ) f B ( xi )
hoặc
fC ( xi ) f D ( xi ) , S H
không phân biệt được sự khác nhau dương hay âm, do đó vẫn có trường hợp
loại I như sau: Giả sử A ( x,0.3,0.3 , B ( x,0.4,0.4) , C ( x,0.3,0.4 và
D ( x,0.4,0.3) , theo công thức (2) ta có S H ( A, B ) S H (C , D ) 0.9 vì vậy
không phải là trực cảm nhất quán.
Ngoài
ra,
tA ( xi ) tB ( xi ) f A ( xi ) f B ( xi )
khi
= tC ( xi ) tD ( xi ) fC ( xi ) f D ( xi ) , S H ( A, B ) S H (C , D ) một trường hợp trực
cảm khác (Loại II) xuất hiện khi
A ( x,1,0) ,
B ( x,0,0) và