Tài liệu Đồ án môn học :Công nghệ phần mềm MS SQL Server và Postgre SQL - Pdf 95

MS SQL Server vµ Postgre SQL
Đồ án môn học :Công nghệ phần mềm
Sinh viên thực hiện:
Nguyễn Tuấn Anh
Đỗ Minh Ngọc
Phạm Hồng Phúc
Nguyễn Hoàng Tú
Lớp Tin 7- K44
Phần I. Giới thiệu chung.
1. SQL là gì?
SQL là viết tắt của Structure Query Language, nó là một công cụ quản lý dữ liệu
được sử dụng phổ biến ở nhiều lĩnh vực. Hầu hết các ngôn ngữ bậc cao đều có trình
hỗ trợ SQL như Visual Basic,Oracle,Visual C
Trong Oracle tất cả các chương trình và người sử dụng phải sử dụng SQL để truy
nhập vào dữ liệu trong CSDL của Oracle. Các chương trình ứng dụng và các công cụ
Oracle cho phép người sử dụng truy nhập tới CSDL mà không cần sử dụng trực tiếp
SQL. Nhưng những ứng dụng đó khi chạy phải sử dụng SQL.
2.Lịch sử phát triển:
SQL được phát triển từ ngôn ngữ SEQUEL2 bởi IBM theo mô hình Codd tại trung
tâm nghiên cứu của IBM ở California vào những năm 70 cho hệ thống quản trị cơ sở
lớn.
Ban đầu SQL được sử dụng trong các ngôn ngữ quản lý CSDL và chạy trên các máy
đơn lẻ. Song do sự phát triển nhanh chóng của nhu cầu xây dựng những CSDL lớn
1
MS SQL Server vµ Postgre SQL
theo mô hình khách chủ( trong mô hình này toàn bộ CSDL được tập trung trên máy
chủ (Server)). Mọi thao tác xử lý dữ liệu được thực hiện trên máy chủ bằng các lệnh
SQL máy trạm chỉ dùng để cập nhập hoặc lấy thông tin từ máy chủ). Ngày nay trong
các ngôn ngữ lập trình bậc cao đều có sự trợ giúp của SQL. Nhất là trong lĩnh vực
phát triển của Internet ngôn ngữ SQL càng đóng vai trò quan trọng hơn. Nó được sử
dụng để nhanh chóng tạo các trang Web động

2
MS SQL Server vµ Postgre SQL
Phần 2 SQL Server.
I. SQL server 2000.
1. Khái niệm.
SQL server là một hệ thống quản lý cơ sở dữ liệu ( RDBMS – Relational Database
Management System ) và sử dụng Transact-SQL để thao tác dữ liệu trên các
máy khách và máy chủ.
Một RDBMS bao gồm những database, data engine, các ứng dụng dùng quản lý dữ
liệu và các bộ phận khác nhau trong RDBMS.
SQL server được tối ưu nhằm tăng khả năng quản lý một khối lượng cơ sở dữ liệu
rất lớn ( very large database environment). Cỡ vào khoảng hàng Tera-Byte và đồng
thời phục vụ hàng ngàn user. Ngoài ra, SQL server còn có thể cùng thao tác với các
loại server khác như IIS ( Microsoft Internet Information Server), E-Commerce
2. Các ấn bản của SQL server 2000
a. Enterprise: có đầy đủ tính năng của một SQL Server. Cho phép chạy tốt
trên hệ thống 32 CPUs và 64 GB RAM. Nó được tích hợp các dịch vụ phân
tích dữ liệu hiệu quả (Analysis Service).
b. Standard: phù hợp cho các công ty vừa và nhỏ do giá thành rẻ hơn
nhiều Enterprise, tất nhiên không thể có đầy đủ các tính năng như ấn bản
trên. Song nó cũng chạy tốt trên hệ thống 4 CPUs và 2 GB Ram.
c. Personal: đây là một ấn bản tối ưu cho phép chạy trên các máy tính cá
nhân và được cài trên hầu hết các phiên bản Window.
d. Developer: có đầy đủ tính năng như ấn bản Enterprise nhưng giới hạn số
lượng người dùng kết nối. Đây là một ấn bản nên cài đặt với người mới sử
dụng trên Window 2000 hay Window NT
e. Desktop Engine: là một engine chạy trên desktop không giao diện người
dùng, kích thước cơ sở dữ liệu giới hạn khoảng 2GB.
3
MS SQL Server vµ Postgre SQL


Mobile Disconnected
Users or Desktop
Database
Relational Database
Engine Personal Edition
or Desktop Engine
Local Database Local Database
Mutli
-Dimensio
n Cube
MS SQL Server vµ Postgre SQL
a. Relational Database Engine: đây là thành phần cơ bản nhất của SQL Server. Nó
có khả năng chứa dữ liệu ở các quy mô khác nhau như dạng bảng hay các kiểu kết
nối thông dụng của Microsoft ( ADO-Activex Data Object, OLE DB, ODBC- Open
Database Connectivity). Bên cạnh đó, nó có khả năng tự điều chỉnh như thêm tài
nguyên của máy khi cần và trả lại tài nguyên cho hệ điều hành khi user log off.
b. Replication: khả năng nhân bản. Nếu một user có một database dùng chứa dữ
liệu được các ứng dụng thường truy cập tới. Tuy nhiên, có lúc user muốn dùng
database này trên server khác để tạo ra một báo cáo nhằm tránh ảnh hưởng cho
server chính. Điều này gây ra một khó khăn là làm thế nào để cập nhập database này
trên server chính. Cơ chế nhân bản cho phép thực hiện
điều này.
c. DTS ( Data Transformation Service): dịch vụ chuyển giao dữ liệu. Khi có người
dùng sử dụng trong một công ty có các dữ liệu được lưu trữ tại nhiều nơi và tại các
dạng khác nhau như Oracle, Microsoft Access, DB2 thì làm thế nào để chuyển dữ
liệu giữa các server có các dữ liệu khác nhau về định dạng như thế này? Chức năng
DTS cho phép chuyển đổi cả về vị trí lẫn chuyển giao các định dạng cho nhau.
d. Analysis Service: dịch vụ phân tích dữ liệu. Đây là một dịch vụ được cung cấp rất
hiệu quả trong việc tìm được những thông tin cần thiết trong database dựa vào khái

instance của SQL Server và cho kết quả dạng XML.
♣ Có các tính năng tối ưu hoá cao, hỗ trợ cho môi trường có khối lượng cơ sở
dữ liệu lớn. Các phiên bản cũ hơn 6.5 có thể hỗ trợ các cơ sở dữ liệu từ
200GB - 300GB, còn đối với 7.0 trở lên là terabyte.
♣ Trình cơ sở dữ liệu quan hệ SQL Server hỗ trợ tạo các index trên các khung
nhìn. Tập hợp kết quả index được xác định lúc index được tạo ra và được
bảo lưu lúc dữ liệu nền tảng được sửa chữa. Nhờ tạo ra một index trên một
khung nhìn, việc thực hiện các phép tính phức tạp trên số lượng dữ liệu lớn
có thể được gia tăng về tốc độ các query liên tiếp theo thứ tự độ rộng.
♣ SQL Server tự động cấu hình khi chạy. Nhiều user cùng kết nối với SQL
Server thì nó có thể sử dụng tài nguyên bổ sung. Nếu các trình ứng dụng
khác cùng chạy trên server thì SQL Server sẽ giảm sử dụng bộ nhớ ảo để
dành các trình ứng dụng kia
♣ Có các tính năng bảo vệ đầy đủ đối với các môi trường nhằm đảm bảo tính an
toàn ngăn các sự cố như nhiều user cùng cố cập nhập cùng một loại dữ liệu
trong một thời điểm.
♣ Nhiều instance SQL Server 2000 có thể cùng chạy trên cùng một máy tính.
Chẳng hạn, 1 công ty cung cấp các dịch vụ cơ sở dữ liệu cho nhiều khách
hàng khác có thể chạy 1 instance của SQL Server cho mỗi khách hàng.
6
MS SQL Server vµ Postgre SQL
♣ Các trình ứng dụng SQL Server có thể chạy trên cùng máy tính với SQL
Server.
II. Transact SQL
1. Khái niệm về Transact SQL (T-SQL)
Thực chất T-SQL là một dạng mở rộng của chuẩn SQL theo ISO ( International
Organization for Standardization) và ANSI ( American National Standards Institute)
được sử dụng trong các SQL Server (nó khác với Procedural-SQL dùng trong
Oracle).
Có thể hiểu T-SQL là một ngôn ngữ chính giúp người dùng giao tiếp với SQL Server.

DECLARE @IdClass
SET @IdClass=3
SELECT * FROM Customers
WHERE IdClassRoom=@IdClass + 2
c. Function: bao gồm những hàm có sẵn và những hàm do người dùng tự xây dựng
Hàm có sẵn lại thuộc vào 3 loại sau:
- Rowset Functions: trả về một đối tượng như là recordset.
- Aggregate Functions: thực hiện tính toán và trả về các giá trị như tổng,
tích, trung bình
- Scalar Functions: làm việc trên các giá trị đơn và trả về giá trị đơn. Nó,
chẳng hạn, cắt lấy phần tháng trong kiểu date
d. Comment: những lời chú thích được đặt trong /* */
4. Thực thi lệnh trong SQL Server.
a. Lệnh đơn.
Đầu tiên, 1 lệnh đơn được phân tích cú pháp thông qua một bộ phân tích cú pháp là
Parser. Tiếp đến, SQL Optimizer sẽ thực thi tối ưu câu lệnh nhằm tăng tốc độ và ít
tốn tài nguyên. Sau đó, SQL Server Engine sẽ thực hiện và trả về kết quả.
b. Tập nhóm lệnh.
SQL Server cũng thực hiện tối ưu cho tập lệnh như các lệnh đơn và tìm cách thực thi
tối ưu nhất. Đồng thời, chứa các lệnh trên đã biên dịch trong bộ nhớ. Sau đó, nếu các
lệnh trên được gọi lại thì nó sẽ được chạy nhanh hơn nhờ không phải biên dịch lại.
8
MS SQL Server vµ Postgre SQL
Bên cạnh đó, còn 1 lệnh mà không thuộc T-SQL. Đó là lệnh GO. Lệnh này thông báo
cho biết kết thúc một tập nhóm lệnh để thực thi tập lệnh.
III. Cơ sở dữ liệu trên SQL Server
1. Cấu trúc của SQL Server.
SQL Server có là một hệ thống multiple-instance như đã nói ở trên. Do vậy, chúng ta
khi nói đến instance nào đó của Server thì hiểu rằng đang nói tới Default instance.
Một instance bất kì của Server bao gồm 4 cơ sở dữ liệu hệ thống và có 1 hay nhiều

trong cùng một mở rộng) và phần đồng bộ ( uniform extend - chỉ chứa dữ liệu của
một bảng table). Đầu tiên, SQL Server thực hiện phần mở rộng hỗn hợp cho dữ liệu
của một bảng và khi dữ liệu tăng trưởng thì chuyển sang phần đồng bộ.
3. Nguyên tắc hoạt động của file Transaction Log.
Như đã nói ở trên, file này ghi nhận sự thay đổi trong cơ sở dữ liệu. Quá trình thực
hiện: khi có sự thay đổi data bằng các lệnh Insert, Update, Delete từ các trình ứng
dụng của người dùng, SQL Server sẽ tải trang dữ liệu tương ứng lên bộ nhớ ( vùng
bộ nhớ này còn gọi là data cache). Tại đây, dữ liệu trên trang này được thay đổi
( những trang này đựơc gọi là dirty page) và những sữ thay đổi này được ghi vào file
này. Sau cùng có một quá trình kiểm tra và ghi vào đĩa cứng nội dung của file này.
Quá trình đó được gọi là Check Point Process. Tuy nhiên, không chỉ có quá trình
trên, còn một quá trình khác mang tên Lazy writer cũng ghi nội dung của file log vào
đĩa theo từng chu kì.
10
database




!"
#$
%
&

'
#$
MS SQL Server vµ Postgre SQL
Chúng ta tiếp tục đi kỹ một chút về tiến trình Check Point này. Transaction nghĩa là
giao dịch. Nhưng giao dịch nhiều khi gây nên những lỗi nguy hiểm. Vậy Check Point
phải có cơ chế thực hiện thích hợp để không gây nhiễu database. Sơ đồ dưới đây

Sp_helpdb[‘login’]: cho biết thông tin của user
IV Sao lưu và phục hồi dữ liệu.
1. Chiến lược phục hồi dữ liệu.
Chúng ta nên biết việc phục hồi dữ liệu là cực kì quan trọng. Khi những sự cố
thường xuyên xảy ra như người dùng vô ý xoá đi một file cơ sở dữ liệu, file hệ thống,
file transaction, bị tấn công bởi virus phải đảm bảo hệ thống phục hồi đầy đủ trong
thời gian sớm nhất. Bởi vậy, cần phải luôn kiểm tra trước khi hệ thống xảy ra sự cố
và tránh số lần sao lưu dự phòng.
2 Một số phương pháp Back Up có trong SQL Server
- Full Database Backups: copy toàn bộ các file trong cơ sở dữ liệu. Như
vậy, mọi thông tin về user, database object, system object đều được sao lưu
đề phòng. Làm như thế này giúp cho khôi phục toàn bộ thông tin nhưng gây
tốn bộ nhớ và tốn thời gian thực hiện.
- Differential Database Backups: copy toàn bộ thay đổi trong database sau
lần full database backup trước đó.
- File or File Group Backups: copy một data file đơn hay một nhóm file
- Differantial File or File Group Backups: copy sự thay đổi của một file hay
một nhóm file.
- Transaction Log Backups: ghi lại những transaction trong transaction
log file kể từ lần transaction log backup gần nhất. Phương pháp này cho ta
phục hồi dữ liệu vào một thời điểm nào đó trong quá khứ mà vẫn đảm bảo tính
đồng nhất.
Trong khi thực hiện quá trình sao lưu, mọi hoạt động của cơ sở dữ liệu cũng được
back up nên có thể sao lưu ngay khi SQL đang chạy.
3. Một số mô hình phục hồi.
12
MS SQL Server vµ Postgre SQL
- Full Recovery Model: phục hồi dữ liệu ít rủi ro nhất. Mọi hoạt động trong
chế độ này như insert, update, delete kể cả insert bằng bulk insert hay bcp
cũng được đưa vào file transaction log. Khi có sự cố ta có thể phục hồi dữ liệu

Các ngày trong tuần đều được đưa vào trong file transaction log. Trong đó riêng
ngày chủ nhật được thực hiện Full Database BackUp còn 2 ngày thứ 3 và thứ 5 thực
hiện lưu trữ những thay đổi. Không may, đến ngày thứ 6, máy tính hỏng đĩa cứng.
Quá trình khôi phục bắt đầu được tiến hành. Chúng ta phải thống nhất rằng file
transaction log được lưu trữ trong một đĩa cứng khác, nghĩa là file này không bị hỏng
cùng với đĩa cứng lưu trữ dữ liệu. Trước tiên, file transaction log này được khôi phục.
Sau đó, phục hồi dữ liệu từ ngày chủ nhật. Copy toàn bộ file dữ liệu vào từ đĩa
backup đến đĩa mới và thực hiện toàn bộ transaction trong transaction log file. Tiếp
tục, lphục hồi dữ liệu ( differental database backup) ngày thứ 5. Cuối cùng, phục hồi
trong các file transaction log sau ngày thứ 5. Người ta gọi đây là quá trình Data
Recovery.
4. BackUp Database
Đây là quá trình cất giữ dữ liệu đề phòng sự cố. Trong SQL Server, chúng ta có thể
tạo ra những backup device hay backup file để thực hiện lưu trữ dữ liệu. Các backup
device thường là cố định để tiện cho việc lưu trữ nhiều lần. Dưới đây là một số thuật
ngữ trong lưu trữ.
Backup: copy toàn bộ một phần hay toàn bộ dữ liệu hay file transaction
log, 1 file hay nhóm file để tạo ra một backup set. Backup set này thường
chứa trên các backup device.
Backup device: thường là một file hay một đĩa để ghi backup set vào
backup media.
Backup file: chứa backup set.
Backup media: là đĩa hay băng từ chứa một hay nhiều backup set.
V. Tính toàn vẹn dữ liệu.
Khi nói đến tính toàn vẹn dữ liệu là nói đến độ chính xác, tin cậy của dữ liệu. Đảm
bảo dữ liệu có độ tin cậy cao là một vấn đề quan trọng trong cơ sở dữ liệu.
1. Phương pháp đảm bảo an toàn dữ liệu.
Trong SQL Server có một số cách nhằm đảm bảo tính an toàn dữ liệu.
14
MS SQL Server vµ Postgre SQL

xác định một hàng bất trong bảng. Đó là cột có thuộc tính khoá chính. Chỉ một cột
duy nhất được có thuộc tính này. Nhiều cột có thể cùng tham gia để tạo nên thuộc
tính này. Khi Primary Key được tạo ra thì Unique Index sẽ tự động tạo ra để duy trì
tính duy nhất. Nếu trong bảng chưa có Clustered Index một Unique và Clustered
Index sẽ được tạo ra. Có nhiều cách cho phép tạo ra thuộc tính Primary Key cho một
cột.
15
MS SQL Server vµ Postgre SQL
CREATE TABLE MyTable (
StudentID INT PRIMARY KEY,
StudentName VARCHAR(30)
)
b Unique Constraint (thuộc tính duy nhất).
Tạo thuộc tính này cho bảng nhằm bảo đảm giá trị của một cột nào đó không bị lặp
lại. Cho dù có những điểm tương đồng giữa Unique và Primary Key nhưng chúng có
những cách dùng khác nhau. Trong một bảng có thể có nhiều Unique nhưng chỉ duy
nhất một Primary Key. Một cột cho phép chứa giá trị Null, thì Unique được đặt lên cột
này nhưng Primary Key thì không.
c. Foreign Key Constraint (thuộc tính khoá ngoài).
Một cột hay nhiều cột được thiết lập thuộc tính này để liên kết với dữ liệu trong bảng
khác. Có thể đặt nhiều Foreign Key trong cùng một bảng để liên kết với bảng khác.
Foreign Key của một bảng này sẽ giữ thuộc tính khoá chính cho bảng khác hay tham
chiếu với cột có tính Unique. Foreign Key có thể có chứa NULL. Mặc dù mục đích
của Foreign Key là quản lý một bảng con nhưng thực tế nó kiểm soát luôn cả bảng
cha. Bởi lẽ, khi ta xoá dữ liệu trong bảng cha thì bảng con không thể liên kết với bảng
cha. Cho nên khi xoá thuộc tính Foreign Key phải kiểm soát vấn đề này.
d. Check Constraint.
Dùng để kiểm soát hay giới hạn giá trị đưa vào trong bảng dữ liệu. Tương tự như
Foreign Key kiểm soát giá trị đưa vào một cột nhưng nó không dựa vào bảng cha để
xác định mà nó dựa vào một biểu thức để xác định điều này.

FROM Employers
Dãy lệnh trên thực hiện lấy dữ liệu hai cột FirstName và LastName từ bảng
Employers vào trong bảng EmployeeNames.
c. GROUP BY và HAVING: là những dãy điều kiện đi kèm khi ta chọn dữ liệu trong
bảng.
SELECT FirstName, LastName
INTO EmployeeNames
FROM Employers
GROUP BY FirstName
HAVING LastName=’Do’
cũng như trên nhưng bây giờ có thêm điều kiện LastName là chuỗi Do và được
nhóm lại bởi FirstName.
d. UNION: kết nối 2 hay nhiều queries thành một kết quả.
SELECT * MyTableOne
UNION ALL
17
MS SQL Server vµ Postgre SQL
SELECT * MyTableTwo
thực hiện việc ghép nối 2 bảng có các cột và kiểu dữ liệu giống hệt nhau, chỉ khác
nhau về giá trị trong các cột. Những hàng giống nhau được ghép mà không bị xoá
bỏ.
2. Lệnh Joins.
Lệnh này cho phép ghép nối các bảng có chung một hay nhiều cột lại với nhau. Có
nhiều Joins. Dưới đây trình bày một số dạng.
a. Inner Joins.
Lệnh này giúp chọn dữ liệu từ 2 hay bảng có chung 1 hay nhiều cột. Các giá trị được
này phải có ở cả 2 bảng.
SELECT t.Title, p.Pub_name
FROM Publishers AS p INNER JOIN Titles AS t
ON p.Pub_id = t.Pub_id

Lệnh này được gõ trong cửa sổ Dos. Đây là xuất dữ liệu từ bảng Orders trong
database PracticeDB ra file dạng văn bản Orders.txt, các cột ngăn với nhau bởi dấu ;
19
MS SQL Server vµ Postgre SQL
Để xuất dữ liệu dùng “out” còn nhập dữ liệu dùng “in”.
-c: là để chỉ xuất kiểu dữ liệu character. Nếu không có, mặc định là dùng TAB
để phân cột và dùng xuống dòng để phân định hàng (“\n”).
T: kết nối với cơ sở dữ liệu. Nếu user được phép vào hệ thống Window thì
cũng được dùng SQL Server.
t; : dấu đi sau t để dùng phân định cột.
bcp "Select * From practiceDB Orders" queryout c:\Orders.txt -c -SVinhtai
-Usa –Pabc
queryout: cho biết đầu ra là query chứ không là bảng.
-S: tên của SQL Server
-U: tên người dùng
-P: mật khẩu người dùng.
2. Truy vấn phân tán.
Khi muốn lựa chọn dữ liệu từ các hệ cơ sở dữ liệu như Access, DB2, Oracle hay một
SQL Server khác dùng truy vấn phân tán để thực thi. Để thực hiện điều này, ta
dùng đến Linked Server hoặc Ad Hoc Computer Name.
a. Linked Server.
Đây là dùng một server ảo để truy nhập vào các hệ cơ sở dữ liệu khác. Sau khi cài
đặt, nó bao gồm 4 phần:
Linked_Server_Name.Catalog.Shema.Object_Name.
VD:
Select * from OPENQUERY(LinkedPracticeDB,'Select * from Customers')
20
2%" 2%0
2%-:
2%8;"<

SQL Server. Loại này bắt đầu bằng xp_.
Remote Stored Procedure: đây là loại dùng để gọi stored procedure của
các server khác.
VIII. SQL Server và mạng.
21
MS SQL Server vµ Postgre SQL
SQL Server trong thực tế sử dụng một cách rất đa dạng. Nó có thể ghép nối với các
SQL Server khác, liên kết với các client, hoặc thực hiện cùng trình ứng dụng ngay
trên một máy tính
1. Các Server SQL được liên kết với nhau.
Với những trang Web có cơ sở dữ liệu lớn vượt quá tải trọng của SQL Server riênglẻ
thì việc kết hợp các SQL Server vào với nhau là một việc quan trọng. Để kết nối các
SQL Server gần nhau, người ta dùng các mạng SAN nhằm hỗ trợ cấp độ chuyển
thông báo cao, giảm tải trọng của CPU, và thời gian chờ thông báo của các SAN
đáng tin cậy hơn LAN hay WAN.
2 SQL Server dưới dạng quản lý cơ sở dữ liệu trong mạng.
22
,.=,>
,?,
@$""
ABCC ! @@

 
 



@@
"=@@>
@"

tin với các IPC. Quá trình quản lý trao đổi thông tin giữa SQL Server và các client
diễn ra như sau:
- Trình ứng dụng gọi đến OLE DB, ODBC, DB-Library, hay Embedded SQL API.
Điều này làm cho OLE DB Provider, SQL Server ODBC driver và DB-Library
DLL được SQL Server sử dụng để trao đổi thông tin.
- OLE DB, ODBC driver, DB-Library DLL gọi một client Net-Library. Sau đó,
client Net-Library gọi một IPC API.
- Các cuộc gọi của client Net-Library chuyển đến một server Net-Library và tiếp
tục chuyển tới instance của SQL Server.
- Quá trình truyền tin từ SQL Server tới client diễn ra ngược lại.
Hình vẽ dưới đây mô tả quá trình này.
24
A0$

A0$

0$D-

A0$

A0$

0$D-
0

B,D
-

B,D
-

,.
,$1@
,.
2!?@!,.
,
!",-
,
!",-
,
!",-
A0"

0$D-


0$D-0
2!?@!
.,D
-

Trích đoạn Giới thiệu về PostgreSQL Cấu trỳc của Postgress SQL Lập trỡnh Perl trong PostgreSQL
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status