BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2 ĐINH THỊ LỰC PHÉP SUY DẪN CỦA CÁC PHỤ THUỘC HÀM
TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI
LUẬN VĂN THẠC SỸ MÁY TÍNH
Chuyên ngành: Khoa học máy tính
Mã ngành: 60 48 01 01
Ngƣời hƣớng dẫn khoa học: PGS.TS. Trịnh Đình Thắng
MỤC LỤC
MỞ ĐẦU 1
CHƢƠNG 1: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ VÀ CÁC PHÉP SUY
DẪN 3
1. 1. Các khái niệm cơ bản 3
1.1.1. Thuộc tính và miền thuộc tính 3
1.1.2. Quan hệ, lƣợc đồ quan hệ và khoá của quan hệ 3
1.2. Các phép toán đại số quan hệ. 5
1.2.1. Phép hợp và phép giao 5
1.2.2. Phép trừ và tích Đề-các 6
1.2.3. Phép chiếu, phép chọn và phép kết nối 7
1.3. Cácphụ thuộc hàm 10
1.3.1.Các tính chất của phụ thuộc hàm [6] 11
1.3.2. Hệ tiên đề Amstrong và các phép suy dẫn[6] 11
1.4. Bao đóng. 13
1.4.1. Bao đóng của tập phụ thuộc hàm và của tập thuộc tính 13
1.4.2. Bài toán thành viên và thuật toán tìm bao đóng của tập thuộc tính 16
1.5. Khoá và các dạng chuẩn của lƣợc đồ quan hệ 18
các mô hình dữ liệu thích hợp đã có một số mô hình đƣợc sử dụng trong các
hệ thống cở sở dữ liệu nhƣ: mô hình thực thể - liên kết, mô hình mạng, mô
hình phân cấp, mô hình hƣớng đối tƣợng, mô hình dữ liệu datalog và mô
hình quan hệ. Trong số các mô hình này thì có ba mô hình dữ liệu thƣờng
đƣợc sử dụng là mô hình phân cấp, mô hình mạng và mô hình quan hệ. Đối
với ba mô hình này thì mô hình quan hệ đƣợc quan tâm hơn cả. Mô hình
này đƣợc E. Codd đề xuất năm 1970. Tuy nhiên do các quan hệ có cấu trúc
phẳng (tuyến tính) nên mô hình này chƣa đủ đáp ứng đối với các ứng dụng
phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến tính,…
Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình dữ liệu
quan hệ đã đƣợc nhiều nhà khoa học quan tâm. Theo hƣớng nghiên cứu này
một mô hình dữ liệu mới đã đƣợc đề xuất đó là mô hình dữ liệu dạng khối.
Mô hình dữ liệu này đƣợc xem là một mở rộng của mô hình dữ liệu quan hệ.
Để hoàn thiện cho lý thuyết về mô hình dữ liệu dạng khối em đã
chọn đề tài “Phép suy dẫn của các phụ thuộc hàm trong mô hình dữ liệu
dạng khối”. Nhằm chứng minh tính chất các phép suy dẫn nhƣ suy dẫn theo
tiên đề, suy dẫn theo khối, suy dẫn theo quan hệ, các định lí tƣơng đƣơng.
1. Mục đích nghiên cứu
Nghiên cứu về các phép suy dẫn của các phụ thuộc hàm trong mô hình dữ
liệu dạng khối nhƣ suy dẫn theo tiên đề, suy dẫn theo quan hệ, định lí các
phép suy dẫn tƣơng đƣơng.
2. Nhiệm vụ nghiên cứu
Tìm hiểu về mô hình cơ sở dữ liệu quan hệ.
Tìm hiểu về mô hình cơ sở dữ liệu dạng khối
2
Nghiên cứu về các phép suy dẫn của các phụ thuộc hàm trong mô hình dữ
liệu dạng khối.
4. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng, phạm vi nghiên cứu về các phép suy dẫn trong mô hình dữ liệu
- Thuộc tính là đặc trƣng của đối tƣợng.
-
Tập tất cả các giá trị có thể có của thuộc tính A
i
gọi là miền giá trịcủa
thuộc tính đó, ký hiệu: Dom(A
i
) hay viết tắt là D
Ai
Ví dụ 1.1:
Đối tƣợng Sinhviên có các thuộc tính nhƣ: MaSV, Hoten, NgSinh, Đchi,
Miền giá trị của các thuộc tính của đối tƣợng Sinh viên :
Dom(MaNV) = {char(4)} ={„SV01‟, „SV02‟, „SV03‟ };
Dom(Hoten) = {char(30)} ={„Nguyễn Văn A‟,„Nguyễn Văn B‟, } ;
Dom(NgSinh) = {date} ={„20/03/78‟, „15/12/96‟, } ;
Dom(Đchi) ={char(10)} ={„ĐN‟, „NĐ‟, „VP‟, …}.
1.1.2. Quan hệ, lƣợc đồ quan hệ và khoá của quan hệ
Định nghĩa 1.2[6]
Cho U= {A
1
, A
2
, …, A
n
} là một tập hữu hạn không rỗng các thuộc tính.
Mỗi thuộc tính A
i
(i=1,2, …, n) có miền giá trị là Dom(A
i
i
(i=1, 2, ,n).
Ta có thể xem một quan hệ nhƣ một bảng, trong đó mỗi hàng (phần tử)
là một bộ và mỗi cột tƣơng ứng với một thành phần gọi là thuộc tính. Biểu
diễn quan hệ r thành bảng nhƣ sau:
4 A
1
A
2
…
A
n
h
1
h
1
(A
1
)
h
1
…
…
…
h
m
h
m
(A
1
)
h
m
(A
2
)
…
h
m
(A
n
)
Bảng 1.1: Biểu diễn quan hệ r.
Ví dụ 1.2:
Trong đó các thuộc tính là MaSV: mã sinh viên; HOTEN: họ tên; NS: ngày
, , A
n
).
Định nghĩa 1.4[6]
Khoá của quan hệ r xác định trên tập thuộc tính U={A
1
, A
2
, , A
n
} là
tập con K
U sao cho bất kỳ hai bộ khác nhau t
1
, t
2
r luôn thoả t
1
(K) ≠
Sinhviên
MaSV
HOTEN
NS
DC
KHOA
SV01
A
Ta có thuộc tính MaSV là khóa của quan hệ.
1.2. Các phép toán đại số quan hệ.
Định nghĩa 1.5[6]
Hai quan hệ r và s đƣợc gọi là khả hợp nếu nhƣ hai quan hệ này xác
định trên cùng tập thuộc tính và các thuộc tính cùng tên có cùng miền giá trị.
1.2.1. Phép hợp và phép giao
a)Phép hợp
- Phép hợp hai quan hệ khả hợp r và s, kí hiệu là r ∪ s, là tập tất cả các bộ
thuộc r hoặc thuộc s. Ta có: r ∪ s = {t│ t ∈ r ∨t ∈s}
Ví dụ 1.4:
r (A B C) ; s (A B C)
x
1
y
1
z
1
x
1
y
1
z
1
x
2
y
1
x
2
y
2
z
1
x
2
y
2
z
2
Sinhviên
MaSV
HOTEN
NS
DC
KHOA
SV01
A
24/01/92
ĐN
TOAN
SV02
B
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1r ∩ s (A B C)
x
1
y
1
z
1
1.2.2. Phép trừ và tích Đề-các
2
x
2
y
2
z
1
r - s = (A B C) s - r = (A B C)
x
2
y
1
z
2
x
2
y
2
z
2
x
2
y
2
z
1
m
)│(a
1
, a
2
, , a
n
) ∈r
(b
1
b
2
, , b
m
) ∈s}
Ví dụ 1.7 :
Bảng 1.2: Biểu diễn các quan hệ r, s và quan hệ r× s.
1.2.3. Phép chiếu, phép chọn và phép kết nối
a) Phép chiếu
Cho r là một quan hệ n ngôi xác định trên tập thuộc tính U={A
1
, A
2
, , A
n
}, X
z
1
x
1
y
1
z
1
x
2
y
2
z
2
x
1
y
1
z
1
y
1
z
2
x
2
y
2
z
2
x
2
y
1
z
2
x
1
y
2
x
2
y
2
z
2
x
2
y
2
z
1
x
1
y
2
z
2
r
A
B
1
z
2x
2
y
2
z
2x
2
y
2
z
1x
1
y
(B)
1
5
8
BD
(r)
(B D)
1 4
5 2
5 5
8 5
b) Phép chọn
Phép chọn là phép toán lọc lấy ra một tập con các bộ của quan hệ đã
cho thoả mãn một điều kiện xác định. Điều kiện đó đƣợc gọi là điều kiện
chọn hay biểu thức chọn.
Biểu thức chọn F đƣợc định nghĩa là một tổ hợp logic của các toán hạng, mỗi
toán hạng là một phép so sánh đơn giản giữa hai biến là hai thuộc tính hoặc
giữa một biến là một thuộc tính và một giá trị hằng. Biểu thức chọn F cho giá
9
trị đúng hoặc sai đối với mỗi bộ đã cho của quan hệ khi kiểm tra riêng bộ đó.
- Các phép toán so sánh trong biểu thức F: >, <, =, ≥, ≠, ≤.
- Các phép toán logic trong biểu thức F: ∧ (và), ∨ (hoặc),
(phủ định).
Cho r là một quan hệ và F là một biểu thức logic trên các thuộc tính của
r. Phép chọn trên quan hệ r với biểu thức chọn F, kí hiệu là
F
y
1
5 y 4
z
1
5 z 5
x
1
8 x 5
c) Phép kết nối
Cho hai quan hệ r(U) và s(V). Đặt M=U∩V. Phép kết nối(tự nhiên) hai
quan hệ r(U) và s(V), ký hiệu r*s, cho ta quan hệ giữa các bộ đƣợc dán từ các
bộ u của quan hệ R với mỗi bộ v của quan hệ S (sao cho các trị trên miền
thuộc tính chung M của hai bộ này giống nhau).
P(UV)= r*s= {u*v│u∈r, v∈s, u.M=v.M} .
Nếu M= U∩V=Ф, r*s sẽ cho ta tích Đề- các, trong đó mỗi bộ của quan
hệ r sẽ đƣợc ghép với mọi bộ của quan hệ s.
10
Ví dụ 1.10:
r (A B C) ; s (G H)
x
1
x x
2
x
2
x
3
y
2
y
3
x
1
x z
2
y
2
y
3
1.3. Các phụ thuộc hàm
Khi xét đến mối quan hệ giữa dữ liệu trong CSDL quan hệ một trong
nhƣng yếu tố quan trọng nhất đƣợc xét đến là sự phụ thuộc giữa các thuộc
tính này với thuộc tính khác. Từ đó có thể xây dựng những ràng buộc cũng
nhƣ loại bỏ đi những dƣ thừa dữ liệu trong một CSDL.
Phụ thuộc hàm là những mối quan hệ giữa các thuộc tính trong CSDL
quan hệ. Khái niệm về phụ thuộc hàm có một vai trò rất quan trọng trong việc
thiết kế mô hình dữ liệu. Một trạng thái phụ thuộc hàm chỉ ra rằng giá trị của
một thuộc tính đƣợc quyết định một cách duy nhất bởi giá trị của thuộc tính
khác.Sử dụng các phụ thuộc hàm để chuẩn hóa lƣợc đồ quan hệ về dạng
chuẩn 3 hoặc chuẩn Boye-Codd.
Định nghĩa 1.6 [6]
Cho lƣợc đồ quan hệ R xác định trên tập thuộc tính U, và X, Y ⊆U.
Nói rằng, X xác định hàm Y hay Y phụ thuộc hàm vào X và kí hiệu X → Y
nếu với mọi quan hệ r xác định trên R và với hai bộ bất kỳ t
1
Tính chất 5) Nếu X → Y, Z → W thì XZ →YW.
Tính chất 6) Nếu X → Ythì XZ→Y.
Tính chất 7)Nếu X → Y, X→ Z thì X → YZ.
Tính chất 8)Nếu X → YZ thì X → Y.
Tính chất 9) Nếu X → YZ, Z → WV thì X → YZW.
1.3.2. Hệ tiên đề Amstrong và các phép suy dẫn[6]
Gọi R là quan hệ trên tập thuộc tính U. Khi đó với các tập thuộc tính X,
Y, Z⊆ U ta có hệ tiên đề Amstrong nhƣ sau:
1- Tính phản xạ: Nếu Y ⊆ X thì X → Y
2- Tính tăng trƣởng: Nếu X → Y thì XW → YW
3- Tính bắc cầu: Nếu X → Y, Y → Z thì X → Z
Định lý 1.1
Hệ tiên đề Amstrong là đúng và đầy đủ
Chứng minh:
a)Tính đúng.
1)Với mọi t
1
, t
2
r(R) và t
1
(X) = t
2
(X), cần chứng minh t
1
(Y) = t
2
(Y).
Thật vậy, từ giả thiếtt
1
(YW)
12
Phản chứng: Giả sử t
1
(YW) ≠t
2
(YW).
Theo giả thiết có t
1
(XW) = t
2
(XW)⇒ t
1
(X)= t
2
(X)
t
1
(W)= t
2
(W)
Nên để có t
1
(YW) ≠t
2
(YW) thì t
1
(Y) ≠t
1
(X) = t
2
(X), cần chứng minh t
1
(Z) = t
2
(Z)
Phản chứng: Giả sử t
1
(Z) ≠t
2
(Z).
Theo giả thiết X → Y nên t
1
(X) = t
2
(X) ⇒ t
1
(Y) = t
2
(Y).
Mặt khác, cũng theo giả thiết có Y → Z nên t
1
(Y) = t
2
(Y) ⇒t
1
(Z)= t
2
M
t
1
1
1
1
1
1
1
t
2
1
1
1
0
0
0
Trong đó, các thuộc tính trong t
1
đều có giá trị1, các thuộc tính trong t
2
chỉ
có các thuộc tính thuộc X
+
X
+
thì X → W, mà W → V nên X → V (theo tính chất bắc cầu). Do
A
X
+
nên X → A hay A
X
+
. Điều đó là vô lý, bởi vì A
X
+
Kết luận với mọi phụ thuộc hàm F đều thỏa trên r.
Tiếp theo ta chứng tỏ rằng X → Y không thỏa mãn trên r
Thật vậy, giả sử X → Y thỏa trên r(R). Nhƣ vậy X
X
+
và Y
X
+
, vì nếu
không sẽ vi phạm sự bằng nhau trên các bộ t
1
, t
các phụ thuộc hàm F. Bao đóng của tập thuộc tính X đối với F kí hiệu X
+
là
tập tất cả các thuộc tính A mà X → A đƣợc suy diễn từ F. Ta có:
X
+
= {A│ X → A ∈ F
+
}.
Đôi khi ta kí hiệu X
F
+
để chỉ lấy bao đóng của X theo tập phụ thuộc hàm F.
Tính chất của bao đóng:
1) X ⊆X
+
2) Nếu X ⊆ Y thì X
+
⊆Y
+
3) X → X
+
4) X
++
= X
+
+
.
Ta có A ∈ X
{A}⊆ X suy ra X → A (luật phản xạ)⇒ A ∈X
+
.
2) Lấy A ∈ X
+
, ta cần chứng minh A ∈ Y
+
.
Ta có A ∈ X
+
⇒X → A(1).
Mà theo luật phản xạ X⊆Y ⇒Y → X (2).
Vậy từ (1) và (2) ta suy ra Y→ A ⇒ A∈ Y
+
.
3) Giả sử X
+
=A
1
A
2
A
k
Do A
1
X
++
⊆ X
+
Theo tính chất 1 ta có X
+
⊆ X
++
. Ta cần chứng minh X
++
⊆ X
+
Lấy A ∈ X
++
, chứng minh A ∈ X
+
.
Do A ∈ X
++
⇒X
+
→ A(1).
Mặt khác theo tính chất 3 ta có: X → X
+
(2).
Từ (1) và (2) suy ra X→ A ⇒ A ∈ X
+
.
+
⊆ (XY)
+
(3).
Từ (1), (2) và (3) suy ra X
+
Y⊆ (XY)
+
⇒(X
+
Y)
+
⊆ (XY)
++
= (XY)
+
(theo
tính chất 4).
Vậy ta có ⇒(X
+
Y)
+
⊆ (XY)
+
(4).
Mặt khác ta cũng có: X ⊆ X
+
(tính chất 1) ⇒XY⊆ X
+
Y
Từ (1), (2) suy ra X→ Y⇒A ∈ X
+
.
b) Giả sử cóA ⊆ X
+
ta cần chứng minh X→Y.
Do Y ⊆ X
+
⇒X
+
→ Y(luật phản xạ).
Mặt khác: X→ X
+
(theo tính chất 3).
Suy ra: X→ Y(luật bắc cầu).
8) Chứng minh X→ Yvà Y→ X
X
+
= Y
+
ta có:
a) Giả sử có X→ Y và Y→ X ta cần chứng minh X
+
=Y
+
.
Do X→ Y ⇒ Y ⊆ X
+
+
= Y
+
ta cần chứng minh X→Y và Y→ X
Do X
+
= Y
+
nên ta có
Y
+
⊆ X
+
(1‟)
X
+
⊆ Y
+
(2‟)
Theo tính chất 1 ta có Y ⊆ Y
+
mà Y
+
⊆ X
+
⇒Y ⊆ X
+
⇒ X→Y (theo tính
chất 7).
1.4.2. Bài toán thành viên và thuật toán tìm bao đóng của tập thuộc tính
Giả sử Y= {A
i1
, A
i2
, ,A
ik
}
{A
1
…A
n
} với A
1
…A
n là các thuộc tính
và Y ⊆ X
+
.
Từ định nghĩa X
+
ta có X → A
i
, áp dụng hệ tiên đề Amstrong cho
mỗi i suy ra X → Y nhờ luật hợp.
Ngƣợc lại, giả sử ta có X → Y, áp dụng hệ tiên đề Amstrong cho mỗi i
ta có X → A
i
, A
i
• Thuật toán tìm bao đóng của tập thuộc tính:
Thuật toán 1.2: Tìm bao đóng của tập thuộc tính
Dữ liệu đầu vào:F, X ⊆ U.
Ra: X
+
là bao đóng của X đối với F.
Phƣơng pháp:
Tính liên tiếp các tập thuộc tính X
0
, X
1
, X
2
, theo các bƣớc sau:
Bƣớc 0: đặt X
0
= X.
Bƣớc i: Tính X
i
từ X
i-1
nhƣ sau:
18 X
i
= X
i-1
∪{A} nếu tồn tại Y → Z ∈ F mà Y
.
Định lý 1.2
Thuật toán tìm bao đóng X
+
là đúng.
Ví dụ 1.12:
Cho tập thuộc tính U = {A, B, C, D, E, G, H} và tập phụ thuộc hàm
F = {A → D, AB → DE, CE → G, E → H}.
Tính (AB)
+
F
?
Bƣớc 0 : X
0 = AB.
Bƣớc 1: X
1 = X0 ∪ {D} vì ∃ A → D thoả mãn điều kiện.
Bƣớc 2: X
2 = X1 ∪ {E} vì ∃ AB → DE thoả mãn điều kiện.
Bƣớc 3: X
3 = X2 ∪ {H} vì ∃ E → H thoả mãn điều kiện.
Bƣớc 4: X
4 = X3.
Vậy AB
+
F
= {ABDEH}
1.5. Khoá và các dạng chuẩn của lƣợc đồ quan hệ
Định nghĩa 1.9[6]
Cho lƣợc đồ quan hệ R xác định trên tập thuộc tính U = {A
1
khóa (hoặc thuộc tính thứ cấp) và kí hiệu là F
n
.
Một lƣợc đồ quan hệ có thể có nhiều khóa và tập thuộc tính không khóa
cũng có thể bằng rỗng.
• Khoá là một khái niệm rất quan trọng trong việc thiết kế một cơ sở dữ
liệu quan hệ. Khoá thường được áp dụng trong việc tìm kiếm hay cập nhật dữ
liệu trong các cơ sở dữ liệu quan hệ.
Thuật toán tìm khóa của lƣợc đồ quan hệ R
Thuật toán 1.3:
Vào : U, F (U = {A
1
, A
2
, , A
n
}).
Ra: K là khoá của một lƣợc đồ quan hệ R.
Phƣơng pháp:
Bƣớc 0: đặt K
0
= U.
Bƣớc i : Ki = (K
i-1
- {A
i
}) Nếu (K
i-1
- {A
suy dẫn logic) từ tập phụ thuộc hàm F kí hiệu F ⊨ f nếu f ∈ F
+
. Nói cách khác
f đƣợc suy dẫn theo các tiên đề từ tập phụ thuộc hàm F nếu nhƣ áp dụng hệ
tiên đề Amstrong đối với các phụ thuộc hàm trong F thì sau hữu hạn lần ta sẽ
thu đƣợc f.
Để xem xét các phép suy dẫn trên mô hình quan hệ ta hãy xét các phụ thuộc
hàm sau đây:
1.6.1. Phụ thuộc kết nối (Join Dependencies)
Định nghĩa 1.13[1]
Cho PRS = (U, D, dom) là một lƣợc đồ nguyên thủy
Cho X
1
, …., X
k
U với
k
i 1
X
i
= U
Một phụ thuộc kết nối (Join Dependencies) trên PRS ký hiệu là X
1
* * X
k
là một ràng buôc sao cho một quan hệ r trên PRS thỏa ràng buộc này nếu và
chỉ nếur = r