154
Chương 4
MÔ HÌNH CƠ SỞ DỮ LIỆU MỜ
THEO CÁCH TIẾP CẬN ðẠI SỐ GIA TỬ 4.1. Mô hình biểu diễn CSDL mờ theo cách tiếp cận ðại số gia tử
Xét một lược ñồ CSDL trên miền vũ trụ U = {A
1
, A
2
, …, A
n
}. Mỗi
thuộc tính A
i
ñược gắn với một miền trị thuộc tính, ký hiệu là Dom(A
i
), trong
ñó một số thuộc tính cho phép nhận các giá trị ngôn ngữ trong lưu trữ hay
trong các câu truy vấn và ñược gọi là thuộc tính mờ. Các thuộc tính còn lại
ñược gọi là thuộc tính kinh ñiển. Thuộc tính kinh ñiển A
i
ñược gắn với một
miền giá trị kinh ñiển, ký hiệu là
i
A
D
. Thuộc tính mờ A
) với G = {0, c
-
, W, c
+
, 1
}, H = H
-
∪ H
+
với giả thiết H
−
=
{h
1
,h
2
, , h
p
}, H
+
= {h
-1
, , h
-q
}, h
1
> h
2
là hai phép tính với ngữ nghĩa là cận trên ñúng và cận
dưới ñúng của tập H(x), tức là
Σ
x = supremum H(x) and
Φ
x = infimum H(x),
quan hệ ≤ là quan hệ sắp thứ tự tuyến tính trên X cảm sinh từ ngữ nghĩa của
ngôn ngữ.
4.1.1. Ngữ nghĩa dữ liệu dựa trên việc ñịnh lượng ðại số gia tử
4.1.1.1. ðặt vấn ñề
Cho một CSDL DB = {U ; R
1
, R
2
, …., R
n
; Const}, với U = {A
1
, A
2
,….,
A
n
} là tập vũ trụ các thuộc tính, R
1
, R
2
D
∪
i
A
LD
, với
i
A
D
là tập các giá trị kinh ñiển của A
i
,
i
A
LD
là tập các giá trị
ngôn ngữ của A
i
. Tuy nhiên, ñể rút gọn khi trình bày, trong chương này nếu
cho U = {A
1
, A
2
,…., A
n
} thì ta cũng gọi U là một lược ñồ quan hệ.
Ví dụ 4.1. Cho lược ñồ quan hệ U = {STT, TEN, SOCTRINH, SONCSINH,
NAMSINH} và quan hệ Lylichkhoa hoc ñược xác ñịnh như sau:
SOCTRINH
, D
SONCSINH
∪ LD
SONCSINH
. Do ñó, ñối với
mô hình CSDL mờ này, các khái niệm như lược ñồ, quan hệ, bộ dữ liệu ñược
hiểu tương tự như trong CSDL quan hệ. Tuy nhiên, miền trị của các thuộc tính
mờ ñược xác ñịnh là một tập bao gồm miền trị kinh ñiển và miền giá trị ngôn
ngữ ñược sinh ra khi tác ñộng các gia tử vào các phần tử sinh. Chẳng hạn,
trong quan hệ Lylichkhoahoc, miền trị thuộc tính LD
SOCTRINH
, LD
SONCSINH
chứa hai phần tử ít và nhiều. Vấn ñề ñặt ra ở ñây, tìm một phương pháp ñối
sánh dữ liệu ñể ứng dụng thao tác dữ liệu trên miền trị của các thuộc tính mờ.
Ví dụ tìm những cán bộ có nhiều công trình khoa học và hướng dẫn rất nhiều
nghiên cứu sinh. Nếu chúng ta xem LD
SOCTRINH
, LD
SONCSINH
là hai ðSGT và
các giá trị nhiều, rất nhiều thuộc hai ðSGT ñó, thì việc ñối sánh dữ liệu trên
miền trị của thuộc tính mờ sẽ ñược dựa trên ñịnh lượng ngữ nghĩa của ðSGT.
ðể ñề xuất các phép ñối sánh dữ liệu trên mô hình CSDL mờ, một số
ñịnh nghĩa ñược giới thiệu. Các ñịnh lý, hệ quả và bổ ñề liên quan ñược chúng
ta trình bày làm cơ sở cho phần tiếp theo.
4.1.1.2. Ngữ nghĩa dữ liệu dựa trên việc ñịnh lượng ðSGT
Ai
= [0,1]. Do ñó, xây dựng phân hoạch của Dom(A
i
)
trở thành xây dựng phân hoạch của [0,1].
ðịnh nghĩa 4.1. Cho X
k
= {x∈X: |x| = k}, xét P
k
= {I(x): x∈X
k
} là một phân
hoạch của [0,1]. Gọi
υ
là hàm ñịnh lượng ngữ nghĩa trên X.
(1) u bằng v theo mức k, ñược ký hiệu u =
k
v, khi và chỉ khi I(u) và I(v)
cùng chứa trong một khoảng mờ mức k. Có nghĩa là với ∀u, v∈X, u =
k
v ⇔
∃∆
k
∈ P
k
: I(u) ⊆ ∆
k
và I(v) ⊆ ∆
{I(trẻ), I(già)} là một phân hoạch của [0,1]. Tương tự, P
2
= {I(hơn trẻ), I(rất
trẻ), I(ít trẻ), I(khả năng trẻ), I(hơn già), I(rất già), I(ít già), I(khả năng già)}
là phân hoạch của [0,1].
(a) Ta có P
1
là phân hoạch của [0,1]. Do ñó hơn trẻ
=
1
rất trẻ vì ∃∆
1
= I(trẻ) ∈
P
1
: I(hơn trẻ) ⊆ ∆
1
và I(rất trẻ) ⊆ ∆
1
.
Ta có P
2
là phân hoạch của [0,1]. Do ñó ít già
=
2
rất ít già vì ∃∆
2
=I(ít già
Từ (1’) và (2’) suy ra ít trẻ
≠
2
rất trẻ. Hơn nữa, vì ít trẻ
≠
2
rất trẻ và
υ
(ít trẻ
)
>
υ
(rất trẻ) nên ít trẻ
>
2
rất trẻ.
158
Bổ ñề 4.1. Quan hệ =
k
là một quan hệ tương ñương trong P
k
.
Chứng minh: Tính phản xạ : Ta chứng minh bằng quy nạp.
∀x∈Dom(A
i
ñúng với k = 1, hay x =
1
x.
Giả sử |x| = n ñúng, có nghĩa =
k
ñúng với k = n, hay x =
n
x, ta cần chứng minh
=
k
ñúng với k = n+1. ðặt x = h
1
x’, với |x’| = n. Vì x =
n
x nên theo ñịnh nghĩa ta
có: ∃∆
n
∈ P
n
: I(x) ⊆ ∆
n
. Mặc khác ta có P
n+1
= {I(h
1
x’), I(h
2
x’),…….}, với h
1
≠
khay ∃∆
k
∈ P
k
: I(y) ⊆ ∆
k
và I(x) ⊆ ∆
k
. Vậy y =
k
x thì y =
k
x.
Tính bắc cầu: Ta chứng minh bằng phương pháp qui nạp
Trường hợp k = 1
Ta có P
1
= {I(c
+
), I(c
-
)}, nếu x =
1
y và y =
1
z thì ∃∆
1
và I(z) ⊆ ∆
1
hay x =
1
z. Vậy =
k
ñúng với k = 1.
Giả sử quan hệ =
k
ñúng với trường hợp k = n có nghĩa là ta có ∀x, y, z
∈Dom(A
i
)
nếu x =
n
y và y =
n
z thì x =
n
z.
Ta cần chứng minh quan hệ =
k
ñúng với trường hợp k = n+1. Tức là ∀x, y, z
∈Dom(A
i
)
nếu x =
n +1
x =
n+1
z.
Bổ ñề 4.2. Cho u = h
n
…h
1
x và v = h’
m
…h’
1
x là biểu diễn chính tắc của u và v
ñối với x.
(1): Nếu u = v thì u =
k
v với mọi k.
(2): Nếu h
1
≠ h’
1
thì u =
|x|
v.
Chứng minh:
(1) Ta có u =
k
u và v =
k
∆
1
và I(h’
1
x) ⊆ ∆
1
hay h
1
x =
1
h’
1
x. Vậy u =
|x|
v.
Nếu |u| ≠ |v|, do h
1
≠ h’
1
nên I(h
1
x) ⊄ I(h’
1
x) (1’). Giả sử ∃ k >1 sao cho
u =
k
v thì ∃∆
k
∈P
k
…
h
1
x) hay I(h
n
…h
1
x) ⊆ I(h
k-1
… h
1
x) và I(h’
m
….h’
1
x) ⊆ I(h
k-1
… h
1
x) ñiều này
mâu thuẩn vì I(h’
m
….h’
1
x) ⊄ I(h
k-1
… h
1
x) do (1’).
Nếu chọn ∆
x)
⊄ I(h’
k-1
… h’
1
x) do (1’). Vậy không tồn tại k > 1 sao cho u =
k
v hay k = 1. Vậy
u =
|x|
v.
Ví dụ 4.3. Cho u = rất hơn trẻ và v = hơn rất trẻ. Ta có h
1
= hơn, h’
1
= rất, x =
trẻ. Vì h
1
≠ h’
1
nên theo tính chất (2) của bổ ñề 4.2 ta có u =
|trẻ|
v, hay u =
1
v.
ðịnh lý 4.1. Cho X
k
k
= {I(h
k-1
…h
1
x), I(h’
k-1
…h
1
x)}. Vì u =
k
v nên theo
ñịnh nghĩa ∃∆
k
∈ P
k
: I(u) ⊆ ∆
k
và I(v) ⊆ ∆
k
(1’).
Ta có P
1
= {I(x)}, P
2
= {I(h
1
x), I(h’
1
x)},…P
1
x) ⊆ I(x) nên ∃∆
k
= I(h
k-1
…h
1
x) ∈P
k
hoặc
∃∆
k
= I(h’
k-1
…h’
1
x) ∈P
k
và ∃∆
k-1
= I(h
k-2
…h
1
x)∈P
k-1
hoặc ∃∆
k-1
= I(h’
k-
(2’).
160
Từ (1’) và (2’) ta có I(u) ⊆ ∆
k
⊆∆
k-1
⊆….⊆ ∆
2
⊆ ∆
1
và I(v) ⊆ ∆
k
⊆ ∆
k-1
⊆….⊆
∆
2
⊆ ∆
1
, có nghĩa là ∀ 0 < k’< k luôn ∃∆
k’
∈P
k’
: I(u) ⊆ ∆
k’
và I(v) ⊆ ∆
k’
. Vậy
∀ 0 < k’< k nếu u =
k
2
h
1
x. ðặt x’ = h
1
x ta có u = h
n
…h
2
x’ và v =
h’
m
…h’
2
x’. Vì h
2
≠ h’
2
nên theo bổ ñề 2.3 ta có u =
|x’|
v (do |x’| = 2, |x| = 1) hay
u =
2
v. Vậy u =
j+|x|
v.
Nếu j ≠1, ñặt k = j, ta cần chứng minh u =
k+|x|
v. Vì u =
k
h
k-1
…h
1
x.
ðặt x’ = h
k
h
k-1
….h
1
x ta có u = h
n
…h
k+1
x’ và v = h’
m
…h’
k+1
x’. Vì h
k+1
≠
h’
k+1
nên theo bổ ñề 2.2 ta có u =
|x’|
v hay u =
k+|x|
v (do |x’| = k, |x| = 1).
v.
Bổ ñề 4.3. Cho X
k
={x∈X: |x| = k}, xét P
k
={I(x): x∈X
k
} là một phân hoạch
của [0,1], u = h
n
….h
1
x và v = h’
m
….h’
1
x là biểu diễn chính tắc của u và v ñối
với x.
(1) Nếu tồn tại chỉ số k ≤ min(m,n) lớn nhất sao cho u =
k
v thì u ≠
k+1
v.
(2) Nếu u <
k
v hoặc u >
k
v thì với ∀ a ∈ H(u), với ∀ b ∈ H(v) ta có a
i
A
LD
,
υ
là hàm ñịnh lượng ngữ nghĩa
của Dom(A
i
). Hàm f : Dom(A
i
) → [0,1] ñược xác ñịnh như sau:
Nếu
i
A
LD
= ∅ và
i
A
D
≠ ∅ thì ∀ω∈Dom(A
i
) ta có f(ω)=
minmax
min
ψψ
ψ
ω
−
−
A
LD
= [ψ
minLV
, ψ
maxLV
]
là miền trị ngôn ngữ của A
i
.
Ví dụ 4.7. Cho miền trị cơ sở U(Tuoi) = {0…100, …rất rất trẻ,……, rất rất
già}.
D
TUOI
= {20, 25, 27, 30, 45, 60, 75, 66, 80}.
LD
TUOI
= {trẻ, rất trẻ, già, hơn trẻ, hơn già, ít già, rất già, rất rất trẻ}.
Dom(TUOI) = D
TUOI
∪ LD
TUOI
. Nếu LD
TUOI
= ∅ khi ñó Dom(TUOI) = D
TUOI
= {20, 25, 27, 30, 45, 60, 75, 66, 80}. Do ñó ∀ω ∈Dom(Tuoi), chuyển ñổi giá
trị ω về một số trong [0,1] nhờ hàm f(ω), ta có Dom(Tuoi) = {0.2, 0.25, 0.27,
υ
(ψ
maxLV
)}/ψ
max
= (ω*0.98)/100, hay
∀ω∈
i
A
D
chuyển ñổi giá trị ω về một số trong [0,1] nhờ hàm f(ω), ta có
i
A
D
=
{0.196, 0.245, 0.264, 0.294, 0.441, 0.588, 0.735, 0.646, 0.784}.
Nếu chúng ta chọn các tham số W và ñộ ño tính mờ cho các gia tử sao
cho
υ
(ψ
maxLV
) =1.0 thì ({ω
*
υ
(ψ
maxLV
)}/ψ
max
)
), với x
k
∈X
k
.
162
Ví dụ 4.8. Cho ðSGT X
= (X, C, H,
≤
), Trong ñó H = H
+
∪
H
-
.
Trong ñó H
+
= {hơn, rất} với hơn < rất và H
-
= {ít, khả năng} với ít > khả
năng.
G = {nhỏ, lớn}. Giả sử cho W = 0.6, fm(hơn) = 0.2, fm(rất) = 0.3, fm(ít) = 0.3,
fm(khả năng) = 0.2, fm(nhỏ) = 0.6, fm(lớn) = 0.4.
Ta có P
2
= {I(hơn lớn), I(rất lớn), I(ít lớn), I(khả năng lớn), I(hơn nhỏ),
I(rất nhỏ), I(ít nhỏ), I(khả năng nhỏ)} là phân hoạch của [0,1]. Ta có fm(rất
lớn) = 0.12, fm(khả năng lớn) = 0.08. Ta có |I(rất lớn)| = fm(rất lớn) = 0.12,
hay I(rất lớn) = [0.88,1]. Do ñó theo ñịnh nghĩa Φ
(1) ∀ x
k
∈ X
k
, Φ
k
(
υ
(x
k
)) = x
k
.
(2) ∀a ∈ I(x
k
),∀ b ∈ I(y
k
), x
k
≠
k
y
k
, nếu a < b thì Φ
k
(a) <
k
Φ
k
(b).
) và b ∈ I(y
k
) nên theo ñịnh nghĩa ta có Φ
k
(a) = x
k
và
Φ
k
(b) = y
k
.
Mặc khác theo giả thiết x
k
≠
k
y
k
nên I(x
k
) ≠ I(y
k
). Vì a < b nên I(x
k
) <
I(y
k
), hay Φ
k
(a) <
Bảng 4.2. Quan hệ Thunhapcanhan 164
Chúng ta thấy rằng các giá trị trên thuộc tính TUOI và THUNHAP rất ña dạng,
tuy nhiên, chúng ta chỉ quan tâm ñến vấn ñề xử lý các giá trị khoảng. Vì vậy,
tất cả các giá trị trên quan hệ Thunhapcanhan có thể chuyển về các giá trị
khoảng tương ứng. Một cách tổng quát, nếu là giá trị a ta chuyển thành [a,a],
nếu là giá trị khoảng a ta chuyển thành [a-ε, a+ε], với ε ñược xem là bán kính
với tâm a. Nếu giá trị từ a ñến b, thì ñược chuyển thành [a,b]. Do ñó, quan hệ
Thunhapcanhan có thể chuyển thành quan hệ sau:
STT TEN TUOI THUNHAP
1
An
[30, 30]
[2.500.000, 2.500.000]
2 Hải [23, 27] [1.500.000, 1.500.000]
3 Hằng [25, 40] [3.400.000, 3.600.000]
4 Phương [45, 50] [1.500.00, 1.800.000]
5 Thúy [45, 45] [9.00.00, 1.100.000]
Bảng 4.3. Quan hệ Thunhapcanhan (sau khi chuyển ñổi), với ε
TUOI
2 Hải [0.23, 0.27] [0.18, 0.18]
3 Hằng [0.25, 0.4] [0.52, 0.56]
4 Phương [0.45, 0.50] [0.18, 0.23]
5 Thúy [0.45, 0.45] [0.07, 0.11]
Bảng 4.4. Quan hệ Thunhapcanhan sau khi sử dụng hàm f
165
4.1.2.2. ðối sánh các giá trị khoảng
Cho ðSGT X = (X, G, H, ≤ ) và một giá trị khoảng [a,b]. ðể so sánh
một giá trị x∈X với [a,b], trước hết chuyển [a,b] về ñoạn con của [0,1]. Vì tính
mờ của x là một ñoạn con của [0,1], do ñó ñể so sánh x∈X và ñoạn con [0,1],
chúng ta chỉ cần dựa vào phần giao của hai ñoạn con của [0,1] tương ứng.
Với x∈X, ký hiệu I(x) ⊆ [0,1] và |I(x)| = fm(x), [I
a
,I
b
] = [f(a),f(b)] ⊆
[0,1] tương ứng với việc chuyển ñổi giá trị khoảng [a,b] về ñoạn con của [0,1].
(1) Với mỗi [I
a
,I
b
] nếu tồn tại x∈X sao cho [I
a
,I
b
] ⊆ I(x) thì [a,b] =
a
,I
b
]∩I(x)| ≥ |[I
a
,I
b
]|/ £ thì [a,b] =
|x|
x.
I
a
I
b I(x) I(x
1
)
Hình vẽ 4.3. Khi [I
a
,I
b
]⊄ I(x) (i)
ngược lại nếu |[I
a
,I
b
] ∩ I(x
] ∩ I(x
i
) ≠ ∅.
(3) Với mỗi [I
a
,I
b
] nếu tồn tại x∈X sao cho [I
a
,I
b
] ∩ I(x) = ∅ thì:
Nếu tồn tại z∈X sao cho [I
a
,I
b
] ⊆ I(z) và I(x) ⊆ I(z) thì [a,b] =
|z|
x.
166
I
a
I
b
I(x)
I(z)
Hình vẽ 4.5. Khi [I
I(hơn trẻ) = [0.15,0.3], I(khả năng trẻ) = [0.3,0.45], I(ít trẻ) = [0.45,0.6]
Ta có fm(rất già) = 0.1, fm(hơn già) = 0.1, fm(ít già) = 0.1, fm(khả năng già) =
0.1.
Vì ít già < khả năng già < già < hơn già < rất già nên I(ít già) = [0.6,0.7],
I(khả năng già) = [0.7,0.8], I(hơn già) = [0.8,0.9], I(rất già) = [0.9,1].
Hình vẽ 4.6. Tính mờ của trẻ và già
Vì [0.23,0.27] ⊆ I(hơn trẻ) mà [f(23),f(27)] = [0.23,0.27] nên [23,27] =
2
hơn trẻ. Hay khoảng 25 =
2
hơn trẻ. Tương tự ta có [0.25,0.4] ∩ I(hơn trẻ) =
[0.25,0.3] và [0.25,0.4] ∩ I(khả năng trẻ) = [0.3,0.4].
Mặt khác ta có |[0.25,0.3]| = 0.05, |[0.3,0.4]| = 0.1, |[0.25,0.4]|/2 =
0.075. Vì [f(25),f(40)] = [0.25,0.4] và |[0.25,0.4] ∩ I(khả năng trẻ)| ≥
|[0.25,0.4]|/2 nên [25,40] =
2
khả năng trẻ.
167
4.1.3. Ngữ nghĩa dữ liệu dựa trên lân cận tôpô của ðSGT
4.1.3.1. ðộ tương tự mức k
Chúng ta có thể lấy các khoảng mờ của các phần tử ñộ dài k làm ñộ
tương tự giữa các phần tử, nghĩa là các phần tử mà các giá trị ñại diện của
chúng thuộc cùng một khoảng mờ mức k là tương tự mức k. Tuy nhiên, theo
cách xây dựng các khoảng mờ mức k, giá trị ñại diện của các phần từ x có ñộ
2
c
−
) ≤ I(h
1
c
−
) ≤
υ
A
(c
−
)
≤ I(h
-1
c
−
) ≤ I(h
-2
c
−
) ≤ … ≤ I(h
-q+1
c
−
) ≤ I(h
-q
c
−
). Khi ñó, ta xây dựng phân
) \ [I(h
-q
c
+
) ∪ I(h
p
c
+
)] và S(1) = I(h
p
c
+
).
Ta thấy, trừ hai ñiểm ñầu mút
υ
A
(0) = 0 và
υ
A
(1) = 1, các giá trị ñại
diện
υ
A
(c
−
),
υ
A
(W) và
υ
i
c
+
)] với hai khoàng mờ kề là I(h
i-1
c
+
) và I(h
i+1
c
+
) chúng ta
sẽ có các lớp tương ñương dạng sau: S(h
i
c
+
) = I(h
i
c
+
) \ [I(h
p
h
i
c
+
) ∪ I(h
-q
h
i
i
c
+
) ∪ I(h
p
h
i
c
+
), với i
sao cho -q ≤ i ≤ p và i ≠ 0.
168
Bằng cách tương tự như vậy ta có thể xây dựng các phân hoạch các lớp
tương tự mức k bất kỳ.
Các giá trị kinh ñiển và các giá trị ngôn ngữ ñược gọi là có ñộ tương tự
mức k nếu các giá trị ñại diện của chúng (ở ñây ñại diện của giá trị thực là
chính nó) cùng nằm trong một lớp tương tự mức k.
4.1.3.2. Lân cận mức k của khái niệm mờ
Giả sử phân hoạch các lớp tương tự mức k là các khoảng S(x
1
), S(x
2
),
…, S(x
m
). Khi ñó, mỗi giá trị ngôn ngữ u chỉ và chỉ thuộc về một lớp tương tự,
chẳng hạn ñó là S(x
2
[A
i
] ∈
i
A
D
thì t
1
[A
i
] = t
2
[A
i
] ;
(2) Nếu một trong hai giá trị t
1
[A
i
], t
2
[A
i
] là khái niệm mờ, chẳng hạn ñó
là t
1
[A
i
], thì ta phải có t
2
[A
i
]).
Như thông thường, nếu ñiều kiện t
1
[A
i
] =
k
t
2
[A
i
] không xảy ra ta có
t
1
[A
i
] ≠
k
t
2
[A
i
].
Do quan hệ tương tự mức k ñược xây dựng bằng một phân hoạch của
ñoạn [0,1], nên có thể thấy quan hệ =
k
là tương ñương trên [0,1]. Ngoài ra, ta
(t
1
[A
i
]) hay
Ω
k
(t
2
[A
i
]). Nghĩa
là, việc kiểm chứng t
1
[A
i
] =
k
t
2
[A
i
] ñược ñưa về việc kiểm chứng các quan hệ
ñối sánh kinh ñiển. Hơn nữa, tính mềm dẻo trong thích nghi với các ứng dụng
cụ thể có thể ñạt ñược bằng việc ñiều chỉnh các tham số của ánh xạ ñịnh lượng
i
A
υ
. ðây chính là ưu ñiểm nổi bật của cách tiếp cận ñại số ñến thông tin mờ.
Dựa trên quan hệ tương ñương này ta có thể dễ dàng ñịnh nghĩa các quan hệ
Ω
k
(y) khi u < v, với mọi u ∈
Ω
k
(x) và mọi v ∈
Ω
k
(y).
ðịnh nghĩa 4.5. Cho U là tập vũ trụ các thuộc tính, r là quan hệ xác ñịnh trên
U, giả sử t
1
và t
2
là hai bộ dữ liệu thuộc quan hệ r. Khi ñó,
(1) Ta viết t
1
[A
i
] ≤
k
t
2
[A
i
], nếu t
1
[A
i
i
], nếu
Ω
k
(t
1
[A
i
]) <
Ω
k
(t
2
[A
i
]);
(3) Ta viết t
1
[A
i
] >
k
t
2
[A
i
], nếu
Ω
k
(t
Dom(A
i
). Hơn nữa, mỗi giá trị x của A
i
có duy nhất một lân cận mức k,
i
A
υ
(x)
là ñiểm trong của
Ω
k
(x) với mọi x∈X.
Mệnh ñề 4.1. Quan hệ =
k
là tương ñương trên Dom(A
i
).
4.2. Phụ thuộc dữ liệu trong cơ sở dữ liệu mờ
4.2.1. Phụ thuộc hàm mờ
Như chúng ta ñã biết, trong mô hình quan hệ, hai dạng phụ thuộc dữ
liệu quan trọng giúp cho việc chuẩn hoá tốt các CSDL là phụ thuộc hàm và
phụ thuộc ña trị. Khi mở rộng mô hình quan hệ ñể có thể biểu diễn và xử lý
ñược những thông tin không chắc chắn, không ñầy ñủ gọi chung là dữ liệu mờ
ñã có rất nhiều công trình tập trung nghiên cứu mở rộng hai dạng phụ thuộc
này trên mô hình mới. ðối với mô hình trong các công trình này là sự mở
n
, Const}, trong ñó U = {A
1
, A
2
, …, A
n
}
là tập vũ trụ các thuộc tính, const là tập các ràng buộc dữ liệu. Một khi ngữ
nghĩa của CSDL ñược mở rộng, như cho phép lưu trữ trong CSDL các thông
tin không chắc chắn hay cho phép các câu truy vấn chứa các thông tin như
vậy, khi ñó ngữ nghĩa của các phụ thuộc dữ liệu cũng thay ñổi, nghĩa là phải
mở rộng ñịnh nghĩa các dạng phụ thuộc dữ liệu.
Trong thực tế, chúng ta thường gặp các tri thức dạng như Nếu một tập
thể T
1
và
T
2
lao ñộng chăm chỉ như nhau và Tính kỷ luật lao ñộng là tốt thì
Thu nhập của tập thể T
1
và T
2
cao như nhau. Ở ñây ta không nhìn nhận mối
quan hệ trên như là một luật của một cơ sở tri thức nào ñó mà xem như là mối
quan hệ giữa các thuộc tính trong CSDL với thuộc tính Số ngày làm việc trong
tháng, Tính kỷ luật lao ñộng và Thu nhập. Hoặc trong một trường hợp khác
Nếu một tập thể T
t
2
[X], nếu với
mọi A ∈ X, ta có t
1
[A] =
k
t
2
[A].
ðịnh nghĩa 4.6. Cho U là một lược ñồ quan hệ, r là một quan hệ xác ñịnh trên
U, xét X, Y ⊆ U. Ta nói rằng, quan hệ r thỏa mãn phụ thuộc hàm mờ X xác
ñịnh Y với mức k, ký hiệu là X
~>
k
Y nếu ta có: với ∀ t
1
, t
2
∈ r, t
1
[X] =
k
t
2
[X]
⇒ t
1
(khả
năng) = 0.25,
µ
(ít) = 0.20,
µ
(hơn) = 0.15 và
µ
(rất) = 0.40. Ta phân hoạch
ñoạn [0, 30] thành 5 khoảng tương tự mức 1 là: fm(rất cao) × 30 = 0.35 × 0.35
× 30 = 3.675. Vậy S(1) × 30 = (26.325, 30];
(fm(khả năng cao) + fm(hơn cao)) × 30 = (0.25 × 0.35 + 0.15 × 0.35) ×
30 = 4.2 và S(cao) × 30 = (22.125, 26.325];
172
(fm(ít thấp) + fm(ít cao)) × 30 = (0.25 × 0.65 + 0.25 × 0.35) × 30 = 7.5
và S(W) × 30 = (14.625, 22.125];
(fm(khả năng thấp) + fm(hơn thấp)) × 30 = (0.25 × 0.65 + 0.15 × 0.65)
× 30 = 7.8 và S(thấp) × 30 = (6.825, 14.625], S(0) × 30 = [0, 6.825].
(b). ðối với thuộc tính THUNHAP: fm(cao) = 0.6, fm(thấp) = 0.4,
µ
(khả năng) = 0.15,
µ
(ít) = 0.25,
µ
(hơn) = 0.25 và
µ
(rất) = 0.35. Ta phân
hoạch ñoạn [0, 100] thành 5 khoảng tương tự mức 1 là: fm(rất cao) × 100 =
0.35 × 0.6 × 100 = 21. Vậy S(1) × 100 = (79, 100];
(fm(khả năng cao) + fm(hơn cao)) × 100 = (0.25 × 0.6 + 0.15 × 0.6) ×
100 = 24 và S(cao)) × 100 = (55, 79];
là họ tất cả các phụ thuộc hàm mờ X ~>
k
Y trên lược ñồ quan hệ
U. Ta ký hiệu
F
FF
F
k
+
là tập tất cả các phụ thuộc hàm mờ X ~>
k
Y mà ñược suy
diễn từ
F
FF
F
k
, tức là với mọi quan hệ r trên U, nếu r thỏa các thụ thuộc dữ liệu
173
trong
F
FF
F
k
thì r cũng thỏa X ~>
k
Y. Ta có thể dễ dàng kiểm chứng họ các phụ
thuộc hàm mờ
F
FF
⇒ XZ ~>
k
YZ ∈
F
FF
F
k
+
.
(3) Bắc cầu: X ~>
k
Y ∈
F
FF
F
k
+
, Y ~>
k
Z ∈
F
FF
F
k
+
⇒ X ~>
k
Z ∈
F
FF
k
t
2
[X] ⇒ t
1
[X] =
k
t
2
[X], hay X ~>
k
X ∈
F
FF
F
k
+
.
(2): Vì X ~>
k
Y ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh nghĩa ta có với ∀t
1
, t
t
2
[Z] (1’).
Từ t
1
[Y] =
k
t
2
[Y] và t
1
[Z] =
k
t
2
[Z] suy ra t
1
[YZ] =
k
t
2
[YZ] (2’). Vậy, từ (1’), (2’)
ta có ∀t
1
, t
2
∈ r, t
1
[XZ] =
∈ r,
t
1
[X] =
k
t
2
[X] ⇒ t
1
[Y] =
k
t
2
[Y] (1’) và Y ~>
k
Z ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh
nghĩa ta có với ∀t
1
, t
2
∈ r, t
1
[Y] =
k
+
.
(4): Vì X ~>
k
Y ∈
F
FF
F
k
+
(giả thiết) nên theo ñịnh nghĩa ta có với ∀t
1
, t
2
∈ r, t
1
[X]
=
k
t
2
[X] ⇒ t
1
[Y] =
k
t
2
[Y]. Ta có ∀t
1
, t
[Y] với
mọi 0 < k’≤ k (2’). Từ (1’), (2’) ta có với ∀t
1
, t
2
∈ r, t
1
[X] =
k’
t
2
[X] ⇒ t
1
[Y] =
k’
t
2
[Y] với mọi 0 < k’≤ k, hay X ~>
k’
Y ∈
F
FF
F
k
+
với mọi 0 < k’≤ k.
Tính ñầy ñủ của hệ tiên ñề (1)-(4)
Chúng ta dễ dàng thấy rằng trong một quan hệ 2-bộ r với các bộ t
1
Vì vậy, cũng như ñối với họ phụ thuộc hàm kinh ñiển, nếu X ~>
k
Y ∉
F
FF
F
k
+
thì
tồn tại một quan hệ 2-bộ r sao cho r thỏa
F
FF
F
k
nhưng không thỏa phụ thuộc hàm
mờ X ~>
k
Y. Có nghĩa là, hệ tiên ñề (1)-(4) trong ñịnh lý 4.4 là ñầy ñủ.
Như vậy, chúng ta thấy ở mức cú pháp, phụ thuộc hàm mờ trùng với
phụ thuộc hàm kinh ñiển nhưng ngữ nghĩa khác nhau, ñặc biệt một quan hệ r
có thể thỏa mãn một phụ thuộc hàm mờ X ~>
k
Y nào ñó nhưng không nhất
thiết phải thỏa mãn X ~>
k
Y với tư cách là một phụ thuộc hàm kinh ñiển.
Vì phụ thuộc hàm kinh ñiển là trường hợp riêng của phụ thuộc hàm mờ,
nên ta có mệnh ñề thể hiện mối quan hệ giữa hai loại phụ thuộc này.
Mệnh ñề 4.2
F
k
+
.
Chứng minh :
(1): Vì X → Y nên với ∀t
1
, t
2
∈ r, t
1
[X] = t
2
[X] ⇒ t
1
[Y] = t
2
[Y]. Mặc khác, ta
có t
1
[X] = t
2
[X] ⇒ t
1
[X] =
k
t
2
[X] và t
1
FF
F
k
+
.
(2): Vì Y → Z nên với ∀t
1
, t
2
∈ r, t
1
[Y] = t
2
[Y] ⇒ t
1
[Z] = t
2
[Z]. Mặc khác, ta
có t
1
[Y] = t
2
[Y] ⇒ t
1
[Y] =
k
t
2
[Y] và t
1
FF
F
k
+
.
Một phụ thuộc hàm mờ X ~>
k
Y ñúng trong quan hệ r có nghĩa là “với mọi”
hai bộ dữ liệu bất kỳ thuộc quan hệ r, nếu giá trị trên tập thuộc tính X bằng
nhau theo mức k thì giá trị trên tập thuộc tính Y bằng nhau theo mức k. Tuy
nhiên, trong thực tế, khi xét một quan hệ nào ñó, có thể “tồn tại” hai bộ dữ
liệu mà giá trị trên tập thuộc tính X bằng nhau theo mức k nhưng giá trị trên
tập thuộc tính Y khác nhau theo mức k. Như vậy, ở ñây không tồn tại phụ
thuộc hàm mờ, bởi vì nó không thoả mãn “với mọi” nhưng có thể thoả mãn
175
“hầu hết” hoặc “một ít”, các dạng phụ thuộc này ñược gọi là phụ thuộc hàm
mờ với lượng từ ngôn ngữ. 4.2.2. Phụ thuộc hàm mờ với lượng từ ngôn ngữ
4.2.2.1. ðặt vấn ñề
Chúng ta thường gặp những tri thức dạng: trong cơ quan những cán bộ
có kinh nghiệm làm việc xấp xỉ nhau thì có thu nhập xấp xỉ nhau. ðối với
dạng tri thức như vậy, trong phần 4.2.1 chúng ta ñã nghiên cứu và gọi ñó là
phụ thuộc hàm mờ. Ở phụ thuộc hàm mờ này có ý nghĩa là với mọi hai cán bộ
bất kỳ trong cơ quan nếu có kinh nghiệm làm việc xấp xỉ nhau thì có thu nhập
xấp xỉ nhau. Tuy nhiên, trong thực tế có những cán bộ có kinh nghiệm làm
việc xấp xỉ nhau nhưng có thu nhập khác nhau do nhiều yếu tố khác tác ñộng
A
: D
r
→ {0, 1} sao cho:
∀x∈D
r
, f
Q
A
(x) = 1 nếu x ≥ ||Q|| và f
Q
A
(x) = 0 nếu ngược lại.
Nếu Q ñơn ñiệu giảm : Ta xây dựng một hàm f
Q
D
: D
r
→ {0, 1} sao cho:
∀x∈D
r
, f
Q
D
(x) = 1 nếu x ≤ ||Q|| và f
Q
D
(x) = 0 nếu ngược lại.
Trường hợp Q là lượng từ tỷ lệ: Khi ta nói hầu hết các bộ dữ liệu t trong r
và lớn, ký hiệu là I(nhỏ) và I(lớn) với ñộ dài tương ứng là fm(nhỏ) và fm(lớn)
sao cho chúng tạo thành một phân hoạch của miền tham chiếu [0,1]. Tiếp ñến,
ñi xây dựng các lớp tương ñương S(1), S(lớn), S(W), S(nhỏ), S(0) dựa vào ñộ
ño tính mờ của các gia tử và các khái niệm nguyên thủy.
Do ñó, nếu gọi ||r
1
||, ||r
2
|| tương ứng là tổng số bộ dữ liệu t trong r thỏa
mãn ñiều kiện (fc
1
, fc
2
, fc
n
) với lượng từ hầu hết và một ít thì ||r
1
|| ∈ S(1) ×
||r|| và ||r
2
|| ∈ S(0) × ||r||.
Như vậy, ta có thể khẳng ñịnh rằng tổng số bộ dữ liệu t trong r thỏa
mãn ñiều kiện (fc
1
, fc
2
, fc
n
) áp dụng với lượng từ Q ñược ký hiệu ||r
Q
≠ t : t[X] =
k
t
’
[X] và t[Y] =
k
t
’
[Y] hoặc là
(2) : Với mọi bộ t
’
≠ t : t[X] ≠
k
t
’
[X].
Khi ñó ta cũng nói bộ t’ thỏa mãn tập X và tập Y trong quan hệ r với mức k,
ñược xác ñịnh t
’
k
(XY) = 1.
ðịnh nghĩa 4.8. Cho U là một lược ñồ quan hệ, r là một quan hệ xác ñịnh trên
U, xét X, Y ⊆ U. Ta nói rằng bộ t thỏa mãn tập X nhưng không thỏa mãn tập
Y trong quan hệ r với mức k, ñược xác ñịnh t
k
(XY)=0 nếu tồn tại bộ t’≠ t : t[X]
=
k
t’ [X] và t[Y]≠
thoa
||/(||r
thoa
|| + ||r
khong
||)
∈S(1), với Q là lượng từ “Hầu hết”.
Ví dụ 4.13. Ta xét lược ñồ quan hệ U = {STT, TEN, HESO, THAMNIEN,
LUONG} với ý nghĩa: Số thứ tự (STT), Tên cán bộ (TEN), Hệ số lương
(HESO) là 3 thuộc tính kinh ñiển, Thâm niên (THAMNIEN), Lương (LUONG)
là 2 thuộc tính mờ. Trong ñó D
THAMNIEN
= [0, 40] và D
LUONG
= [0, 500].
LD
THAMNIEN
và LD
LUONG
có cùng tập các xâu giống nhau với tập các phần tử
sinh là {0, thấp, W, cao, 1} và tập các gia tử là {ít, khả năng, hơn, rất}.
178
(a). ðối với thuộc tính THAMNIEN: fm(cao) = 0.35, fm(thấp) = 0.65,
µ
(khả
năng) = 0.25,
µ
(ít) = 0.20,
Quan hệ Luong trong ví dụ này ñược cho ở bảng 4.6
STT TEN HESO THAMNIEN LUONG
1 Thanh 3.5 20 300
2 Loan 3.7 25 cao
3 Hàng 4.5 36 450
4 Hà 4.3 37 470
5 Thủy 2.5 thấp thấp
6 Nhật 1.9 thấp 185
7 Cường 3.0 27 350
8 Thương 3.1 28 cao
9 Miên 2.8 22 310
Bảng 4.6. Quan hệ Luong