Các kiến thức nền tảng về cơ sở dữ liệu - Pdf 16

Bài 1 Kiến thức nền tảng về Cơ sở dữ liệu
Mục tiêu của bài học:
Cuối bài học này, bạn có thể
 Giải thích vì sao chúng ta cần có cơ sở dữ liệu
 Giải thích sự phát triển của các hệ quản trị cơ sở dữ liệu
 Liệt kê các mô hình cơ sở dữ liệu khác nhau
 Mô tả các khái niệm cơ bản liên quan đến cơ sở dữ liệu
 Mô tả các khái niệm cơ bản liên quan đến cơ sở dữ liệu quan hệ
• Toàn vẹn thực thể (entity integrity)
• Khóa chính (primary key)
• Khóa ngoại (foreign key)
• Các mối quan hệ và bậc của các mối quan hệ (relation and its degree)
 Mô tả tóm tắt giới thiệu về SQL
Giới thiệu
Các tổ chức thường xuyên phải duy trì một khối lượng lớn dữ liệu, chúng là kết quả tạo ra từ các
hoạt động thường ngày. Một cơ sở dữ liệu (CSDL) là dạng được sắp xếp của các dữ liệu như
vậy. Một CSDL có thể chứa một hoặc nhiều mục thông tin có liên quan đến nhau gọi là các bản
ghi (record).
Bạn có thể hình dung CSDL là một tập hợp dữ liệu cho phép chúng ta đặt ra các câu hỏi với nó.
Ví dụ như, “Số điện thoại và địa chỉ của 5 bưu điện gần trường nhất là gì?”, hay “Chúng ta có
quyển sách nào về món ăn có lợi cho sức khỏe trong thư viện không? Nếu có thì chúng nằm ở
những tủ sách nào?”, hay “Hãy cho tôi xem hồ sơ nhân viên và các số liệu kinh doanh của 5 nhân
viên kinh doanh giỏi nhất trong quý này, nhưng không cần xem địa chỉ chi tiết của họ”.
Bài này sẽ đưa ra các khái niệm liên quan đến các CSDL và các hệ quản trị CSDL, khám phá các
mô hình CSDL khác nhau và giới thiệu ngôn ngữ SQL.
1.1. Vì sao Cơ sở dữ liệu là cần thiết?
Các CSDL được dùng để lưu trữ dữ liệu một cách có tổ chức và hiệu quả. Một CSDL cho phép
chúng ta quản lý dữ liệu một cách nhanh chóng và dễ dàng. Ví dụ, một công ty có thể lưu trữ
thông tin chi tiết về các nhân viên công ty trong nhiều CSDL khác nhau. Vào bất cứ thời điểm
nào, chúng ta có thể có thể truy xuất thông tin từ CSDL, thêm dữ liệu mới vào các CSDL và tìm
kiếm dữ liệu theo 1 số tiêu chí nào đó trong các CSDL này.

Quản lí cao cấp, ta chỉ cần sửa lại một nơi trong CSDL. Kết quả là, sự không nhất quán về dữ
liệu được giảm đi.
 Dữ liệu được lưu trữ có thể được chia xẻ
Một CSDL trung tâm có thể đặt tại một máy chủ, chia xẻ cho một số người dùng chung. Theo
cách này, bất cứ lúc nào tất cả mọi người đều có thể truy cập đến thông tin dùng chung và
được cập nhật.
 Có thể thiết lập và tuân theo các chuẩn mực
Việc giám sát tập trung đảm bảo việc có thể thiết lập và tuân theo một chuẩn mực nhất định
về cách biểu diễn thông tin. Ví dụ, tên của một nhân viên phải được biểu diễn dưới dạng ‘Mr.
Larry Finner’, trong đó
• Danh xưng (Mr.)
• Tên (Larry)
2 Khái niệm Hệ quản trị CSDLQH và SQL Server 2000
DEPARTMENTD D_NAMED_NUMBERMGRNAMEMGRSTARTDATED
PROJECTP PNAMEPNUMBERPLOCA
TIONT
EMPLOYEEE NAMESSNBDATEADDRESSN
• Họ (Finner)
Chắc chắn rằng tất cả tên lưu trong CSDL sẽ theo cùng một định dạng nếu như các chuẩn
mực được thiết lập theo cách này.
 Có thể duy trì được tính toàn vẹn dữ liệu
‘Duy trì tính toàn vẹn dữ liệu’ là đảm bảo sự chính xác trong CSDL. Ví dụ, khi một nhân
viên từ chức và rời khỏi cơ quan, xét trường hợp phòng Kế toán đã cập nhật CSDL của mình
nhưng phòng Nhân sự lại chưa cập nhật các hồ sơ của họ. Trong trường hợp này, dữ liệu
trong hồ sơ của cơ quan là không chính xác.
Việc giám sát tập trung CSDL giúp ta tránh được những sai sót này. Chúng ta có thể chắc
chắn là khi một bản ghi được xóa khỏi CSDL, tất cả các bản ghi liên quan trong các bảng
khác cũng được xóa.
 Có thể thực hỉện việc bảo mật dữ liệu
Trong một hệ thống CSDL tập trung, không phải ai cũng được quyền được sửa đổi CSDL.

1.2.2 Mô hình Cơ sở dữ liệu phân cấp hay mô hình Cơ sở dữ liệu đa cấp
Mô hình dữ liệu phân cấp được phát triển để mô hình hóa các loại cơ quan phân cấp trong thế
giới thực. Hình 1.1 minh họa một lược đồ đơn giản cho một giản đồ phân cấp.
a. DEPARTMENT: Research Administration
EMPLOYEE: Smith Max John Grace Elite James Frank
b. DEPARTMENT: Research Administration
PROJECT Product A Product B Computerization New benefits
Hình 1.1: Giản đồ phân cấp
Trong mô CSDL hình phân cấp, Department (phòng ban) được xem như là gốc, nốt cha cao nhất
của cây phân cấp. Các nốt dữ liệu Project và Employee là các nốt con, nốt lá trong mô hình cây
phân cấp. Một đường đi, xuất phát từ một nốt con bên trái qua nốt cha duyệt sang các nốt khác,
lặp đi lặp lại tiến trình này cho đến khi hết tất cả các nốt thì sẽ xác định được cấu trúc phân cấp
của cây.
 Một nốt cha có thể có nhiều nốt con.
 Một nốt con chỉ có một nốt cha.
Từ hình vẽ, ta có thể thấy rõ là trong một phòng ban, có thể có nhiều nhân viên và một phòng ban
có thể có nhiều dự án.
Ưu điểm của mô hình phân cấp
Các ưu điểm của mô hình phân cấp là:
1. Dữ liệu được giữ trong một CSDL dùng chung, do đó việc chia xẻ dữ liệu trở nên dễ dàng
hơn, và hệ quản trị CSDL sẽ cung cấp cũng như thắt chặt việc bảo mật
4 Khái niệm Hệ quản trị CSDLQH và SQL Server 2000
DEPARTMENTD D_NAMED_NUMBERMGRNAMEMGRSTARTDATED
PROJECTP PNAMEPNUMBERPLOCA
TIONT
EMPLOYEEE NAMESSNBDATEADDRESSN
2. Hệ quản trị CSDL mang lại sự độc lập dữ liệu, điều làm giảm bớt nhân lực và chi phí
trong việc bảo trì chương trình.
3. Mô hình này rất hiệu quả khi CSDL chứa một khối lượng lớn dữ liệu. Ví dụ, một hệ thống
tài khoản khách hàng trong một ngân hàng là phù hợp với mô hình phân cấp bởi vì mỗi tài

1. Ngôn ngữ Định nghĩa Dữ liệu (DDL) được dùng để tạo và gỡ bỏ các CSDL và các đối
tượng CSDL. Nó cho phép người quản trị CSDL định nghĩa ra các thành phần của lược đồ.
2. Ngôn ngữ định nghĩa dữ liệu trong lược đồ con (Sub-schema DDL) cho phép người quản
trị CSDL định nghĩa ra các thành phần của CSDL.
3. Ngôn ngữ Thao tác Dữ liệu (DML), cho phép người dùng thêm, lấy ra và sửa đổi thông tin
trong CSDL. Tất cả những người sử dụng CSDL dùng những lệnh này trong hoạt động
thường ngày của CSDL.
4. Ngôn ngữ Kiểm soát Dữ liệu (DCL) được dùng để quản lí quyền truy cập trên CSDL và các
thành phần của CSDL.
Cấu trúc cơ bản
Mô hình phân cấp là một trường hợp đặc biệt của mô hình mạng lưới. Tuy nhiên, thay vì dùng
cấu trúc cây chỉ có một nút cha, mô hình mạng lưới dùng lý thuyết tập hợp để đưa ra mô hình
phân cấp dạng cây với ngoại lệ là các bảng con được phép có nhiều hơn một cha.
Trong mô hình CSDL mạng, một mối quan hệ được gọi là một bộ (set). Mỗi bộ bao gồm ít nhất
hai loại bản ghi: bản ghi chủ, tương đương với nút cha trong mô hình phân cấp, và bản ghi thành
viên, tương đương với nút con trong mô hình phân cấp.
Các ưu điểm của một cấu trúc như vậy được chỉ ra như sau:
1. Việc thiết lập các mối quan hệ trong mô hình CSDL mạng lưới dễ hơn là trong mô hình phân
cấp.
2. Mô hình này tuân thủ chặt chẽ tính toàn vẹn dữ liệu của CSDL.
3. Mô hình này đủ để đạt được sự độc lập dữ liệu.
Các nhược điểm được chỉ ra như sau:
1. Khó thiết kế các CSDL theo mô hình này.
2. Lập trình viên phải rất quen thuộc với các cấu trúc bên trong để truy xuất CSDL.
3. Mô hình này cho ta một môi trường truy cập dữ liệu theo cách duyệt. Do đó, để di chuyển từ
A đến E trong chuỗi A-B-C-D-E, ta phải lần lượt đi qua B, C và D để đến được E.
1.2.4 Mô hình quan hệ
Một nhà khoa học tại trung tâm nghiên cứu của công ty IBM, Tiến sĩ E. F. Codd, không hài lòng
với cách thức mà các hệ quản trị CSDL thời đó xử lý các khối lượng dữ liệu lớn. Ông thấy cần
phải áp đặt các quy luật và nguyên tắc toán học để xử lý các vấn đề của các mô hình trước đó, ví


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status