!"#$%&'!('#$
)*+#$,-!./01"#$2.3""4
"#56!0.$678
)*+#$,-!./01"#$2.3""4
9:;
Việc giảng dạy chuẩn hoá cơ sở dữ liệu thường được dựa vào định nghĩa của các dạng chuẩn. Tuy
nhiên, cách tiếp cận này có thể không phải là cách tốt nhất để giúp IS/ sinh viên công nghệ thông tin có
hiệu quả hiểu quá trình chuẩn hoá cơ sở dữ liệu. Bài báo đề xuất một kỹ thuật thay thế được sử dụng như
là một bổ sung cho các kỹ thuật truyền thống của cơ sở dữ liệu giảng dạy bình thường. Kỹ thuật thay thế
sử dụng phụ thuộc chức năng chuẩn hoá các lược đồ cơ sở dữ liệu. Bài viết này thực nghiệm so sánh
hiệu năng của học sinh về các bài tập chuẩn hoá khác nhau trong đó học sinh được hướng dẫn hoặc sử
dụng các kỹ thuật chuẩn hoá truyền thống được sử dụng và có nghĩa là điểm tập thể dục. Nó cũng cho
thấy học sinh dường như để giữ lại khái niệm của mình để chuẩn hoá các bảng.
<
Hầu hết mỗi hệ thống thông tin kinh doanh ngày nay phát triển sử dụng một cơ sở dữ liệu (Turban,
McLean, & Wetherbe, năm 2002; Hoffer, George, và Valacich, 2002), và hầu như tất cả các cơ sở dữ
liệu dựa trên mô hình quan hệ. Một bước quan trọng trong thiết kế cơ sở dữ liệu quan hệ là cơ sở dữ liệu
chuẩn, như chuẩn hoá một cơ sở dữ liệu đảm bảo thông tin được lưu trữ mà không có sự dư thừa không
cần thiết. Do đó, không có gì ngạc nhiên khi chuẩn hoá là một chủ đề quan trọng trong hầu hết các hệ
thống phân tích và thiết kế (SA & D) các khoá học. Các nhà giáo dục nói chung đồng ý rằng mọi hệ
thống thông tin (IS) hoặc công nghệ thông tin (IT) của học sinh nên học những gì cơ sở dữ liệu chuẩn
hoá được, tại sao họ nên làm điều đó, và lí do tại sao hiệu suất có thể buộc họ huỷ bỏ nó (Mallaach,
1996). Cơ sở dữ liệu chuẩn hoá cũng là một đơn vị tự chọn trong chương trình mô hình khoa học máy
tính (Joint Task Force trên máy tính Chương trình học, 2001)
Cơ sở dữ liệu chuẩn là quá trình chuyển đổi dữ liệu vào cùng – nhóm được thành lập hoặc tự nhiên
như là một thực tế được lưu trữ ở một nơi. Chuẩn hoá quan hệ nói chung là đơn giản hoá và làm giảm
nguy cơ dị thường mà nếu không có thể xảy ra trong quá trình thao tác của các mối quan hệ trong một
cơ sở dữ liệu quan hệ. Hơn nữa, chuẩn hoá dữ liệu được ổn định và, do đó, cung cấp một nền tảng tốt
Codd (1970 và 1972) quan sát thấy rằng mối quan hệ nhất định có thuộc tính cấu trúc mà không được
ưa chuộng cho cơ sở dữ liệu. Quan sát này dẫn ông đi đến định nghĩa về một chuỗi ba dạng chuẩn có
tương quan. Tương quan đầu tiên là dạng chuẩn một (1NF) nếu mỗi miền chứa các giá trị đơn giản. Nói
theo cách khác, chỉ một thuộc tính có thể có giá trị cho từng tồn tại – không phải là một tập các giá trị.
Quy tắc này thường được thể hiện như một thực tế là mối quan hệ không được chứa các nhóm lặp đi lặp
lại.
1NF có hai ưu điểm chính. Đầu tiên, nó cho phép các cơ sở dữ liệu được xem như là một bộ sưu tập
các bảng – một cấu trúc bảng rất đơn giản và dễ hiểu. Thứ hai, nó giúp các học viên mới bắt đầu trong
một lớp học có khả năng xử lý tốt các mối tương quan để đạt được tất cả các kết nối hợp lý cần thiết
trong số các thuộc tính.
Các dạng chuẩn hai và ba được sử dụng để xử lý các bất thường gây ra bởi các yếu tố phụ thuộc chức
năng không mong muốn (FDs) – phụ thuộc giữa các thuộc tính như vậy mà các giá trị của cái gọi là
chức năng thuộc tính phụ thuộc được thuộc tính duy nhất yếu tố quyết định. Để chứng minh cho điều
này, xem xét ví dụ dưới đây, từ ngày (2000), trong đó thông tin có liên quan đến nhà cung cấp, các bộ
phận và các lô hàng được lưu trữ trong một mối quan hệ duy nhất.
FIRST (S#, STATUS, CITY, P#, QUANTITY)
2
Dãy quan hệ này chứa các FDs có vấn đề. Ví dụ, QUANTITY là chức năng phụ thuộc vào S# và P#:
Số lượng của lô hàng là một phần được quyết định bởi một nhà cung cấp và phần cụ thể. Nói theo cách
khác, với mỗi cặp các nhà cung cấp và các bộ phận đã cho, có một số lượng đơn. FD này được viết dưới
dạng sau.
S#, P#
→
QUANTITY
Thêm vào đó, mối quan hệ này còn có những FDs sau:
CITY
→
STATUS
S#
→
SECOND, đặt tên S#. Mỗi giá trị S# xác định một giá trị CITY và giá trị CITY xác định giá trị
STATUS. Giải pháp cho vấn đề này chính là phân tách quan hệ SECOND thành hai quan hệ mới.
SC(S#,CITY)
CS(CITY, STATUS)
SC và CS thuộc dạng chuẩn ba (3NF). Một quan hệ là 3NF nếu nó thuộc 2NF và mọi thuộc tính
không khóa của quan hệ đều không phụ thuộc bắc cầu vào khóa chính. Việc tạo 3NF giúp chúng ta tránh
được những sự cố xảy ra với SECOND. Ví dụ, một người có thể ghi lại rằng mỗi CITY xác định có một
STATUS đặc biệt mặc dù nhà cung cấp không thực sự nằm ở thành phố đó. Ngoài ra, một nhà cung cấp
cụ thể có thể bị xóa trong SC mối quan hệ mà không có nguy cơ mất các thông tin của STATUS cho
CITY. Cuối cùng, nếu các STATUS cho mỗi CITY thay đổi, một trong những nhu cầu để làm cho chỉ
có một thay đổi trong CS.
Một mối liên hệ được thường có thể được phân tách theo nhiều cách khác nhau; tuy nhiên, nói chung
thì các phân tách này chỉ chấp nhận được nếu chúng xác hợp không bị mất và được giữ gìn sự phụ thuộc
( Silberschatz et al., 2002; Atzeni, Ceri, Paraboschi, and Torlone, 1999). Sự phân tách được cho là xác
hợp không bị mất nếu thông tin không bị mất trong quá trình phân tách. Nếu R là mối tương quan trong
giản đồ, R
1
và R
2
phân tách các mối quan hệ của R, sự phân tách này là không bị mất nếu R
1
∪
R
2
= R
và ít nhất những phụ thuộc chức năng sau đây là đúng sự thật.
R
1
năng phân tách đai diện là như nhau, vậy nên để lộ ra những cập nhật bất hợp pháp. Ví dụ như, quan hệ
SECOND ở trên có thể được phân tách thành hai bảng.
SC (S#, CITY)
SS (S#, STATUS)
Cả hai phân tách trên đều không bị mất; tuy nhiên, không giống như sự phân tách ban đầu, tái lập thứ
hai giữ gìn được tính phụ thuộc khi FD giữa CITY và STATUS bị mất.
@>9>
Như đã nói, mặc dù nhiều sách giáo khoa về SA & D giới thiệu chi tiết về xử lí, 1 vài giới thiệu
phương thức về chuẩn hóa 1 (tập hợp) bảng. Chúng ta dễ dàng cho học sinh định nghĩa về 1NF, 2NF và
3NF, và hi vọng nó sẽ làm cho các định nghĩa ứng dụng được các vấn đề cụ thể. Đáng tiếc, nhiều mở
đầu học sinh gặp khó khăn vào ứng dụng các định nghĩa. Họ không thể phân biệt được ba dạng chuẩn,
lúng túng về liên kết giữa FDs và dạng chuẩn. Nhiều học sinh yêu cầu thỏa mái hơn cho việc học chuẩn
hóa cơ sở dữ liệu.
4
Hơn nữa, qua một số thăm dò và đã hoàn thành phương thức( Bernstein, 1976; Diedrich và Milton,
1988; Ullman, 1988) xậy dựng được một tập hợp giản đồ d‡ liệu 3NF từ một tập hợp FDs thực sự. Tuy
nhiên, phương thức này đã viết cho con người với nhiều tri thức trong phương thức và liên hệ đại số học.
Nhiếu sinh viên IT/IS đã không có phạm vi trình bày, và sau đó nó trở thành không thích hợp cho việc
sử dụng phương pháp này trong giảng dạy chuẩn hóa cở sở dữ liệu.
Bởi vì điều này, tác giả đã phát triển ba bước kỹ thuật xứ lí. Dưới đây là ví dụ minh họa về phương
pháp kỹ thuật.
Chuẩn hóa liên kết T(A, B, C, D, E, F) với FDs phía dưới.
FD
1
:A →B, C,D.
FD
2
:B →C, D.
FD
3
(3) Chuyển đổi các FDs còn lại để tạo ra sự liên kết
VD: Kết quả FDs là:
FD
1
’:A→B.
5
FD
2
:B→C,D.
FD
3
’:A,E→F.
Từ FDs này, chúng ta tạo tương quan dưới:
T
1
”(A, B)
T
1
”(B, C, D)
T
1
”(A, E, F)
Phần mềm được hỗ trợ để kiểm tra, đây thực sự là 1 bộ các quan hệ đã được chuẩn hóa hoàn toàn. Ở
phụ lục A chứng minh rằng bất cứ bộ nào của các bảng được sinh ra thông qua kỹ thuật chuẩn hóa có
chọn lọc được chuẩn hóa hoàn toàn đến 3NF. Tuy nhiên, phụ lục A cũng chỉ ra rằng , kết quả chỉ giữ
nếu bộ của các phụ thuộc hàm được sử dụng thiết yếu và liền kề( xem phụ lục A để biết các định nghĩa).
Các phụ thuộc hàm được dùng làm ví dụ trong phần nhắc nhở của tài liệu, quả thực đã đáp ứng được
những yêu cầu này.
A?B9C
Bởi những chuẩn hóa gây ra rắc rói phức tạp cho sinh viên nên kĩ thuật chuẩn hóa có chọn lọc đã
1
: A, G → B, C, D, , E, F, G, H, J, K, L, M, N, P
FDC
2
: J → K, L, M, N, P
FDC
3
: M→ N, P
FDC
4
: G → H
=G!8H2J
Sales (Invoice#, Date, Line#, Quantity, S_Price, Coupon_Deduction, , Savings, Sub_Total,
P_name, P_Price, Vendor#, V_name, V_city)
FDs:
FDD
1
: Invoice#, Line# → Date, Quantity, S_Price, Coupon_Deduction, , Savings,
Sub_Total, P_name, P_Price, Vendor#, V_name, V_city.
FDD
2
: Product# → P_Name, P_Price, Vendor#, V_Name, V_City.
FDD
3
: Vendor# → V_Name, V_City.
FDD
4
: Invoice# → Date.
Hai bài tập đồng nhất với một cấu trúc dựa vào sự đồng nhất về chức năng và thuộc tính. Sự khác
nhau giữa hai bài tập là: bài tập 1 là phần lí thuyết, bài tập 2 phần ý nghĩa của HS sử dụng bảng 1
11
, FDC
2
, FDC
3
. Từ FDC
11
có các
thuộc nhiều hơn phía tay phải, xóa các thuộc tính này từ FDC
11
rồi chuyển sang FDC
12
:
FDC
12
: A, G → B, C, D, E, F, J, K ,L.
b.
Thuộc tính K, L, M xảy ra bên tay phải của hai phần FDC
12
và FDC
2
, từ FDC
2
chứa các thuộc tính ít hơn các thuộc tính bên tay phải của nó hơn FDC
12
, loại bỏ chúng từ
FDC
12
và cung cấp cho FDC
13.
R
1
(A, G, B, C, D, E, F, J)
8
R
2
(J, K, L, M)
R
3
(M, N, P)
R
4
(G, H)
Ngoài ra khuyến khích người đọc đảm bảo kết quả các mối quan hệ thực sự bình thường
hoá đầy đủ đến dạng chuẩn 3.
!M!N'OF8PQ#,RS1G!8H2JT
Invoice_Item (Invoice#, Line#, Quantity,S_Price, Counpon_Deduction, Saving,
Sub_Total, Produc#)
Product (Product#, P_Nam, P_Price, Vendor#)
Vendor (Vendor#, v_Name, V_City)
Invoice (Invoice#, Date)
.U8V0
Các bài tập trong lớp được thiết kế để đánh giá học sinh hiểu biết về CSDL bằng PPKT truyền thống
và lựa chọn chuẩn. Cả hai phần bài tập HS cần chú ý sử dụng PPKT thong thường để làm bài tập 1 sau
đó sử dụng PPKT để làm bài tập 2. HS trong bộ phận A sử dụng PPKT truyền thống để làm bài tập 1 và
sử dụng PPKT truyền thống để làm bài tập 2. HS trong phần B sử dụng PPKT truyền thống để làm bài
tập 2 và sau đó dung các giải pháp thay thế để làm bài tập 1. HS trong học phần C sử dụng PPKT lựa
chọn làm bài tập 2 và PPKT truyền thống làm bài tập 1. Giải pháp được tuyên bố khi HS hoàn thành cả
hai bài tập.
Người dạy làm hai bài tập theo quan hệ bình thường. Sinh viên nhậm được4 điểm nếu họ đã có 4
bảng 4. Một tác động đáng kể đã được tìm thấy cho chuỗi ứng dụng trong kĩ thuật truyền thống. Không
có tác động đáng kể mà được tìm thấy cho các kĩ thuật thay thế.
BẢNG 3
9KY:5=g
=hijA
)k#.8l m#$.n" Ko7p0.0.'q#
)'OR#8.[#$ ."O8.F,`'8!r# c_ ^s_a Is_f
)'OR#8.[#$,`'8!r# Ja Jsc] IsJe
t#$ fa Jsaa IsIf
."O8.F,`'8!r# c_ ^sf] b^
10
."O8.F )'OR#8.[#$,`'8!r# Ja ^sb] bJ
t#$ fa ^sfI bJ
Một thực nghiệm ghép nối-t đã được thực hiện để đánh giá tác động của kĩ thuật truyền thống và thay
thế về điểm số trung bình của học sinh (bảng 5).Một tác động đáng kể về điểm số của học sinh đã được
tìm thấy cho kĩ thuật bình thường . Trung bình điểm cho những sinh viên sử dụng kĩ thuật thay thế được
0.82 cao hơn những người sử dụng kĩ thuật truyền thống.
T
Trình tự tác dụng đã có một ảnh hưởng đáng kể có nghĩa là điểm số của học sinh sử dụng kĩ thuật
truyền thống. Điều có thể đề nghị thực hành giúp học sinh hiểu được kĩ thuật truyền thống tốt hơn. Học
sinh nhận được điểm số cao khi họ áp dụng kĩ thuật truyền thống để giải quyết những vấn đề có ý nghĩa.
Cung cấp đầy đủ ý nghĩa hoặc gần thực tế-thế giới ví dụ trong lớp có thể làm tăng sự hiểu biết cho học
sinh về kĩ thật truyền thống và do đó tăng hiệu suất.
Kiểm tra kết nối-t bác bỏ giả thuyết rằng sự khác biệt về điểm số trung bình của học sinh giữa hai kĩ
thuật là số không. Sử dụng kĩ thuật thay thế, sinh viên nhận được điểm số cao hơn so với sử dụng kĩ
thuật truyền thống. Các giải thích có thể cho các quan sát này là rất nhiều. Vì hầu hết sinh viên báo cáo
khó khăn trong việc nắm bắt các khái niệm về các hình thức bình thường khác nhau và đã không có tiếp
xúc trước khi đại số quan hệ, các ưu thế của các kĩ thuật thay thế được giải thích bởi thực tế là nó không
yêu cầu học sinh xác định hình thức bình thường mối quan hệ đang ở hoặc có bao nhiêu mối quan hệ
cần thiết để được tạo ra sau khi phân hủy. Thực hiện tốt hơn các kĩ thuật thay thế có thể có cũng là do
Với các FDs:
Dept# dbudget, mgr#
Emp# proj#, phone#, office#, dept#, area
Emp#, date jobtile, sal, proj#, phone#, office, dept#, area
12
Proj# dept#, pbudget
Office#, dept# area
Phone# office#
Quan hệ bình thường hóa được:
Dept (dept#, dbudget, mgr#)
Employee (emp#, phone#, dept#)
EmployeeHired (emp#, date, jobtitle, sal)
Project (proj#, dbudget)
Office (office#, dept#, area)
Phone (phone#, office)
Học sinh nhận được điểm “A” (4) khi họ đã có 5, 6 mối quan hệ chính xác, một điểm “B” (3) cho 4
quan hệ, một điểm “C” (2) trong 3 mối quan hệ, và một điểm “D” (1) trong 2 mối quan hệ. Nếu không,
họ sẽ nhận được một điểm “F” (0). Bảng 6 cho thấy các kết quả cho các phần khác nhau cho những sinh
viên đã học các bài tập báo cáo trong các phần trước…Chú ý rằng không có học sinh đạt một điểm “F”.
Rõ ràng không thể nói liệu các sinh viên sử dụng kĩ thuật truyền thống hoặc kĩ thuật thay thế trong trả
lời các câu hỏi bình thường. Tuy nhiên, nhà nước đã thực hiện các kì thi giữa kì mạnh mẽ cho thấy học
sinh đã phát triển các kĩ năng cần thiết về bình thường hóa một bộ bàn.
?•j:
Mặc dù kết quả thử nghiệm và chính thức của học sinh về việc kiểm tra giữa kì mạnh mẽ cho
thấy rằng kĩ thuật bình thường hóa thay thế là cựu kì hữu ích để giúp học sinh hiểu một cách bình
thường, một số câu hỏi cần được giải quyết bằng cách nghiên cứu trong tương lai. Ví dụ, các experi-
ment không tài khoản cho rất nhiều kiến thức trước khi học sinh đến có thể có của toán học, cơ sở dữ
liệu, và / hoặc chương trình. Thiết kế nghiên cứu trong tương lai sẽ cần phải xem xét các biến này. Các
yếu tố khác được coi là lớn, giới tính và tổng điểm trung bình của phương sai (MANOVA) mà nhóm
điều tra làm thế nào để biến giới tính và kiến thức trước khi ảnh hưởng đến màn trình diễn.
sinh giảm xuống khi họ áp dụng các kĩ thuật bình thường khác so với các kĩ thuật truyền thống. Một số
sinh viên bày tỏ quan ngại rằng: họ cần thực hành nhiều hơn và họ không biết liệu họ có bị phân hủy
một cách chính xác. Nghiên cứu trong tương lai có thể cải thiện sau khi điều này một trong một số lĩnh
vực. Một con đường cho việc nghiên cứu trong tương lai là phát triển một chuẩn hóa trực tuyến công cụ
cho phép học sinh thực hành rất nhiều thời gian và kiểm tra kết quả của họ bằng tay.
Nó cũng quan trọng để chỉ ra rằng các tác giả không đề xuất sử dụng kĩ thuật thay thế mà chỉ bảo
hiểm bình thường. Theo quan điểm của các tác giả, sinh viên cũng cần phải hiểu lý do đằng sau các khái
niệm về bình thường hóa và phát triển giết chết để xác định phụ thuộc chức năng ở vị trí nắm tay. Tuy
nhiên, kết quả của chúng tôi cho thấy rằng kĩ thuật thay thế có thể cung cấp một phương pháp tốt hơn để
hạy học sinh làm thế nào để bình thường hóa một bảng (bộ) so với các kĩ thuật truyền thống thường sử
dụng để cố gắng cài đặt này cho học sinh.
TÀI LIỆU THAM KHẢO
14
Armstrong,w.w.(1974) “cấu trúc phụ thuộc của hệ cơ sở dữ liệu “ tài liệu 74:580-583.
Atzeni, P, ceri; S, Praboschi, S và Torlone, R(1999) hệ thống quan niệm cơ sở dữ liệu, ngôn ngữ
và kien trúc. Boston:Mcgraw-hill.
Brenstein,P.A(1976)”Ba hệ thống chuẩn hóa từ quan hệ từ sự phụ thuộc hàm”.ACMgiair quyết ở
trong hệ thống dữ liệu 1(4): 277-298.
Bosman, J.s, Emerson, s.l và Darnovsky,M.(2001), trên cuốn sổ tay. Bowman:addison-weysley.
Codd, E.F.(1970) “Một quan hệ mơi của dữ liệu trong hệ cơ sở dữ liệu” .truyền đạt những thônh
tin ACM,,133(tháng 6)377-387.
Codd,E.F (1972)”sự vượt trội của hệ cơ sở mới”.trong R.Rustin(Ed) hệ thống dữ liệu (pp. 33-64)
courant Inst. Comptr.sci-symp.6,Englewood cliffs,NJ:Prentice-Hall.
Date,C.J(2000).giới thiệu về hệ thống cơ sở dữ liệu MA:Addion-wesley
Diederich va Milton,J.(1988) phương pháp mới và những thuật toán nhanh trong cơ sở dữ
liệu.ACM giải quyet trong cơ sở dữ liệu 13(3).339-365.
Fagin,R.(1979)chuaanr hóa và hệ cơ sở dữ liệu điều khiển. cách tiên hành của tổ chức trên sự điều
khiển của dữ liệu.
Hoffer,J,A,Geoge,J.f va valacich,J.s(2002)hệ thống phân tích mới va thiết kế.
Englewood.NJ:prentice Hall