ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC KHOA HỌC
KHOA CÔNG NGHỆ THÔNG TIN
TIỂU LUẬN
MÔN HỌC: LOGIC MỜ VÀ ỨNG DỤNG
Đề tài:
MÔ HÌNH CƠ SỞ DỮ LIỆU HƯỚNG
ĐỐI TƯỢNG MỜ
Giảng viên: Thực hiện: Nhóm 1
TS. Nguyễn Công Hào Trần Mừng
Nguyễn Thị Tố Châu
Nguyễn Văn Đức
Hoàng Minh Đức
Phạm Thị Mỹ Linh
Huế, Tháng 12 Năm 2011
MỤC LỤC
MỞ ĐẦU 3
NỘI DUNG 4
1.Giới thiệu 4
2. Mô hình cơ sở dữ liệu hướng đối tượng mờ (FOOD) 6
2.1 Tính không chắc chắn mức thuộc tính 6
2.2 Tính không chắc chắn mức đối tượng/lớp: 8
2.3 Tính không chắc chắn mức Lớp cha/Lớp con 13
14
Ta có các định nghĩa khoảng giá trị và độ phù hợp đối với các thuộc tính như sau: 15
rngSites(Location)={sw, ssw} 15
RLV(Location,Sites)=0.7 15
rngSites(Temperature)={normal, mild} 15
RLV(Temperature,Sites)=0.3 15
rngForest(Location)={s} 15
chủ yếu liên quan đến các mô hình này đã được nghiên cứu bao gồm: truy vấn và xử
lý dữ liệu, chuẩn hóa và phụ thuộc dữ liệu trong mô hình cơ sở dữ liệu hướng đối
tượng, lập chỉ mục, thiết kế và thực thi…Tiểu luận này tập trung trình bày về một số
khía cạnh chính của mô hình cơ sở dữ liệu hướng đối tượng mờ (FOOD).
Chúng em xin chân thành cảm ơn sự dạy bảo, định hướng nghiên cứu, cung
cấp tài liệu và hướng dẫn của Thầy TS. Nguyễn Công Hào đã giúp chúng em hoàn
thành tiểu luận này. Chúng em cũng xin chân thành cảm ơn các đồng nghiệp, anh chị
em học viên đã đóng góp ý kiến cho chúng em trong tiểu luận này. Do thời gian
cũng như kiến thức có hạn nên chắc chắn không tránh khỏi những thiếu sót, rất
mong nhận được sự góp ý của Thầy và các anh chị em học viên trong lớp để tiểu
luận này hoàn thiện hơn.
NHÓM 1
3
NỘI DUNG
1.Giới thiệu
Các mô hình dữ liệu kinh điển thường không có khả năng biểu diễn và thao
tác các thông tin không chính xác và không chắc chắn mà có thể xuất hiện trong
nhiều ứng dụng thế giới thực. Kể từ đầu những năm 1980, lý thuyết logic mờ
của Zadeh đã được sử dụng để mở rộng nhiều mô hình dữ liệu khác nhau. Mục
đích của việc giới thiệu logic mờ trong cơ sở dữ liệu là để nâng cao các mô hình
kinh điển sao cho thông tin không chắc chắn và không chính xác có thể được
biểu diễn và thao tác. Điều này dẫn đến nhiều đóng góp, chủ yếu là đối với mô
hình quan hệ hoặc dạng liên quan nào đó của nó.
Ngoài ra các tiến bộ nhanh chóng về khả năng tính toán của máy tính đã
mang lại cơ hội cho cơ sở dữ liệu trong các ứng dụng đang nổi lên (ví dụ, CAD /
CAM, đa phương tiện và GIS). Các ứng dụng này đòi hỏi một cách đặc trưng
việc mô hình hóa và thao tác các đối tượng phức tạp và các mối quan hệ ngữ
nghĩa. Người ta đã chứng minh rằng mô hình hướng đối tượng là rất tốt với các
yêu cầu này. Vì mô hình cơ sở dữ liệu quan hệ kinh điển và phần mở rộng mờ
mô hình này.
- Mô hình CSDL HĐT mờ thông minh
Có nhiều đề xuất cho mô hình này, trong đó liên quan đến sự biểu diễn tri
thức dựa trên tính toán với từ; xử lý sự mờ ở các mức thuộc tính, đối tượng/lớp,
lớp/siêu lớp cùng các liên kết khác nhau giữa các lớp.
- Mô hình dựa trên tập thô
Có hai đề xuất cho mô hình này, thứ nhất là mô hình dựa trên hệ thống kiểu
đại số các ràng buộc được định nghĩa một cách hình thức. Mô hình dự liệu này
rất hữu ích trong việc biểu diễn các thực thể dữ liệu không gian và các mối quan
hệ giữa chúng. Thứ hai, là tiếp cận tích hợp sự không chắc chắn vào cơ sở dữ
liệu sử dụng quan hệ không phân biệt được và xấp xĩ trong lý thuyết tập thô.
- Mô hình dựa trên UFO (Uncertainty and Fuzziness in an Object-oriented)
5
Mô hình này cung cấp khả năng ngữ nghĩa nâng cao mô hình hướng đối
tượng để hỗ trợ sự không chính xác về thông tin. Sự không chính xác về thông
tin như vậy được giải quyết bằng phân bố khả năng và được mô hình hóa bằng
cách sử dụng khái niệm đối tượng vai trò. Các đối tượng vai trò này mô hình
hóa thông tin không chính xác cũng như các vai trò không chính xác.
2. Mô hình cơ sở dữ liệu hướng đối tượng mờ (FOOD)
Mô hình FOOD được đề xuất lần đầu tiên là mô hình dữ liệu dựa trên sự
tương tự (similitary-based). Có một tiếp cận khác của Yazici, R. George và
D.Aksoy đã mở rộng mô hình này để biểu diễn tốt hơn tính không chắc chắn.
Mô hình FOOD trong được sử dụng trong tiếp cận này được sử dụng như là mô
hình dữ liệu logic. Phần tiếp theo đây sẽ trình bày tóm tắt mô hình FOOD.
Mô hình FOOD chú ý đến việc biểu diễn thông tin mơ hồ, hay nói cách khác
sự mờ trong FOOD được thể hiện ở ba mức: mức thuộc tính, mức đối tượng/lớp
và mức lớp cha/lớp con.
2.1 Tính không chắc chắn mức thuộc tính
FOOD giải quyết ba kiểu của tính không chắc chắn ở cấp thuộc tính:
a. Kiểu thứ nhất là kiểu không đầy đủ xảy ra khi giá trị của thuộc tính
rất trẻ, trẻ con}
Bảng 2.1: Ma trận tương tự đối với thuộc tính mờ tuổi
Tuổi
Rất già Già Trẻ Rất trẻ Trẻ con
Rất già 1.0 0.7 0.0 0.0 0.0
Già 0.7 1.0 0.0 0.0 0.0
Trẻ 0.0 0.0 1.0 0.8 0.1
Rất trẻ 0.0 0.0 0.8 1.0 0.3
Trẻ con 0.0 0.0 0.1 0.3 1.0
Thuộc tính mờ là thuộc tính đa trị; do đó, nó có thể nhận một tập các giá trị
và các giá trị này được nối kết bởi một trong các thành phần ngữ nghĩa AND,
OR, XOR. Các biểu diễn sau đây được sử dụng cho các thuộc tính đa trị:
Toàn tử
logic
Biểu
diễn
AND <…>
7
OR {…}
XOR […]
Giả sử thuộc tính thời tiết, có miền giá trị {có mây, nắng, dịu mát, lạnh,
nóng, có mây}. Biểu diễn sau đây là hợp lệ:
AND: Giá trị của thuộc tính thời tiết là <có mây, lạnh>, có nghĩa là thời
tiết có nhiều mây và lạnh.
OR: Giá trị của thuộc tính thời tiết là {dịu mát, nóng}, có nghĩa là thời tiết
ôn hòa hoặc nóng, hoặc có thể cả hai.
XOR: Giá trị của thuộc tính thời tiết là [nóng, lạnh], có nghĩa là thời tiết
nóng hoặc lạnh, nhưng không phải cả hai.Ở đây, ý nghĩa của thành phần ngữ
nghĩa XOR là khác với toàn tử logic XOR.
Trong mô hình FOOD, ngữ nghĩa được xác định trong khi định nghĩa
, b
2
> trong đó dom
c
(b) = {b
1
, b
2
, b
3
, b
4
, b
5
, …, b
k
} đối với ngữ nghĩa
AND
rng
c
(c) = [c
1
, c
2
, c
3
] trong đó dom
c
(c) = {c
1
- INC (rng
C
(a
i
) / o
j
(a
i
)) là độ bao hàm giá trị của thuộc tính a
i
đối
với phạm vi của nó. Việc tính toán độ bao hàm phụ thuộc vào ngữ
nghĩa của các thuộc tính mà có thể là một trong số các ngữ nghĩa
AND, OR, XOR.
- RLV (a
i
, C) là độ phù hợp của thuộc tính a
i
. Trung bình trọng số
được sử dụng để tính toán độ thuộc của đối tượng.
Công thức bao hàm đối với thuộc tính mờ:
Việc tính toán độ bao hàm đối với các ngữ nghĩa khác nhau được giải thích dưới
đây:
1 – Ngữ nghĩa AND:
Ngữ nghĩa AND là mạnh vì khi nó yêu cầu tất cả các giá trị xuất hiện cùng một
lúc. Công thức ngữ nghĩa AND như sau:
INC(rng
C
(a
i
FuzzyInteger tuoi;
FuzzyString maumat;
public nhanvien(tuoi){}
}
Cho độ phù hợp của các thuộc tính, định nghĩa khoảng giá trị của thuộc tính tuổi
và giá trị các đối tượng ở thuộc tính tuổi như sau :
RLV(tuoi,Nhanvien)=0.8, RLV(maumat, Nhanvien)=0.2
rng
Nhanvien
(tuoi)=<gia, rat gia>
o
1
(tuoi)= <tre, gia>
o
2
(tuoi)= <gia>
Ma trận tương tự của thuộc tính mờ tuổi cho trong bảng dưới đây
Tuoi Rat gia Gia Tre Rat tre Tre con
Rat gia 1.0 0.7 0.0 0.0 0.0
Gia 0.7 1.0 0.0 0.0 0.0
Tre 0.0 0.0 1.0 0.8 0.1
Rat tre 0.0 0.0 0.8 1.0 0.3
Tre con 0.0 0.0 0.1 0.3 1.0
- INC(rng
nhanvien
(tuoi)/o
1
(tuoi))= Min[Min[Max(µ
S
(gia,tre), µ
S
(gia, rat gia)]]=Min[Min[Max(1), Max(0.7)],
Min[Max(1), Max(0.7)]]=0.7
2- Ngữ nghĩa OR:
Khi các giá trị của một thuộc tính trở nên khác nhau nhiều hơn, độ không chắc
chắn tăng lên. Công thức ngữ nghĩa OR như sau:
INC(rng
C
(a
i
)/o
j
(a
i
)) = Min[Max(µ
S
(x,z)),Threshold(o
j
(a
i
))],
∀x ∈ o
j
(a
i
),∀z ∈ rng
C
(a
i
)
S
(tre,tre), µ
S
(gia,tre), µ
S
(gia,gia)]=Min[1,0,1]=0
- Threshold(o
2
(tuoi)) = 1
- INC(rng
nhanvien
(tuoi)/o
1
(tuoi))= Min[Max(µ
S
(tre,gia), µ
S
(tre,rat gia), µ
S
(gia,gia),
µ
S
(gia,rat gia)),Threshold(o
1
(tuoi))]=Min[Max(0,0,1, 0.7),0]=0
- INC(rng
nhanvien
(tuoi)/o
2
(tuoi))=
giá trị của thuộc tính tuổi và giá trị của hai đối tượng o
1
, o
2
đối với thuộc tính
tuổi như sau:
rng
nhanvien
(tuoi)=[gia, rat gia]
o
1
(tuoi)=[tre, gia]
o
2
(tuoi)=[gia]
- INC(rng
nhanvien
(tuoi)/o
1
(tuoi))= Avg[Max(µ
S
(tre,gia), µ
S
(tre,rat
gia)),Max( µ
S
(gia, gia), µ
S
(gia,rat gia))]= Avg[Max(0,0), Max(1,0.7)]=0.5
- INC(rng
(a
i
)/o
j
(a
i
)) = 1, trong đó R
2
≥ V
2
> V
1
≥ R
1
2 - Giá trị của thuộc tính bên ngoài của phạm vi thuộc tính. Trong trường hợp
này, độ bao hàm là 0.
INC(rng
C
(a
i
)/o
j
(a
i
)) = 0, trong đó R
1
> V
2
> V
1
2
≥ R
2
>
R
1
≥
V
1
4 - Phạm vi và giá trị của thuộc tính giao nhau ở phía dưới của phạm vi.
Trong trường hợp này, độ bao hàm sử dụng công thức sau để tính:
INC(rng
C
(a
i
)/o
j
(a
i
)) = (V
2
- R
1
+ 1) / (V
2
- V
1
+ 1), where R
≥ R
2
≥
V
1
≥
R
1
2.3 Tính không chắc chắn mức Lớp cha/Lớp con
Sự không chắc chắn ở cấp lớp cha/lớp con đề cập đến sự tồn tại của tính thuộc
một phần của một lớp đến các lớp cha của nó. Kiểu không chắc chắn này cho
thấy rằng tính mờ xuất hiện ở phân cấp kế thừa lớp vì sự thừa kế lớp có thể
không được xây dựng một cách chính xác trong một số trường hợp. Độ thuộc
của một lớp C vào lớp cha C
i
của nó được tính theo công thức sau đây:
Trong đó: INC = Min(Max[µ
S
(x,y)]), ∀x ∈ rng
ci
(a
i
), ∀y ∈ rng
c
(a
i
),
13
Ví dụ: Ta tính độ phụ thuộc của lớp Forest vào lớp Sites, ma trận tương tự của các
(ssw,s))]=
Min[0.5,1.0]=0.5
INC(rng
Sites
(Temperature)/rng
Forest
(Temperate))=Min[Max(µ
S
(normal,low),
µ
S
(normal,normal)),Max(µ
S
(mild,low),µ
S
(mild,normal))]=Min[Max(1,0.4),
Max(0.4,0.6)]=0.6
Áp dụng công thức tính độ thuộc của lớp Forest vào lớp Sites, ta có:
µ
Sites
(Forest)=[INC(rng
Sites
(Location)/rng
Forest
(Location))*RLV(Location,Sites)
+INC(rng
Sites
(Temperature)/rng
Forest
(Temperature))*RLV(Temperature,Sites)]