TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO Xpath và ứng dụng bài toán quản lý thông tin sinh viên - Pdf 28

1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGÔN NGỮ XPATH VÀ ỨNG DỤNG
BÀI TOÁN QUẢN LÝ THÔNG TIN SINH VIÊN
Báo cáo môn Cơ sở dữ liệu nâng cao
Nhóm 8: Phạm Huyền Trang
Đinh Thị Hương
HÀ NỘI - 2012
MỤC LỤC
1. Tổng quan về cơ sở dữ liệu XML 3
1.1. XML 3
1.2. Tài liệu XML 7
2. Cách sử dụng một tài liệu XML trong môi trường Visual Studio 8
3. Ngôn ngữ Xpath và ứng dụng bài toán quản lý thông tin sinh viên 9
3.1. Cú pháp của XPath 9
3.2. Ứng dụng vào bài toán quản lý thông tin sinh viên 10
4. Kết luận 16
5. Tài liệu tham khảo 17
2
1. Tổng quan về cơ sở dữ liệu XML
1.1. XML
1.1.1. Khái niệm XML
XML (Extensible Markup language) là ngôn ngữ đánh dấu mở rộng do tổ chức mạng toàn
cầu W3C (world wide web consortium ) định nghĩa, để tạo ra các ngôn ngữ đánh dấu khác
[1, 2, 3]. XML được kết hợp bởi tính mềm dẻo của SGML (Standard Generalized Markup
Language ) và tính đơn giản của HTML có khả năng mô tả nhiều loại dữ liệu khác nhau. Nó
là ngôn ngữ tổng quát dùng để lưu trữ dữ liệu thông qua các thẻ có nghĩa.
XML đưa ra một định dạng chuẩn cho cấu trúc dữ liệu hoặc thông tin bằng việc tự định nghĩa
dạng của tài liệu. Là ngôn ngữ đánh dấu độc lập với phần mềm, phần cứng và nền (cross
-platform). Bằng cách này, dữ liệu được lưu trữ bằng XML sẽ độc lập với việc xử lý. Vì vậy

với khối lượng dữ liệu nhỏ và vừa.
• Mô hình này không thích hợp cho các phần mềm hệ thống quản lý. Rất thích hợp cho
các ứng dụng trên môi trường tin học không có hoặc chưa có hệ quản trị cơ sở dữ liệu
như : điện thoại di động, máy công cụ
Giải pháp 2 : Lưu trữ toàn bộ bên trong cơ sở dữ liệu, tài liệu XML khi đó được nhúng
vào nội dung các bảng dữ liệu
Hình2: Mô hình kểt hợp lưu trữ cả tập tin XML và cơ sở dữ liệu
Ưu điểm : Tận dụng được cả hai cách lưu trữ đó là lưu trữ trên tập tin và lưu trữ trên hệ quản
trị cơ sở dữ liệu.
4
Nhược điểm: Không phải tập tin XML nào cũng có thể đọc/ ghi bằng đối tượng database vì
có nhiều tập tin XML lưu trữ phức tạp
Giải pháp 3:
Hình 3: Mô hình giải pháp 3
Ưu điểm : Mô hình này nghiêng về việc lưu trữ trên tập tin XML. Việc trao đổi giữa một đối
tượng XMLDOM và cơ sở dữ liệu quan hệ cũng dễ dàng vì từ SQL Server2000 trở lên đã hỗ
trợ truy xuất trên tập tin XML.
Nhược điểm : Mặc dù từ SQL 2000 trở lên đã có hỗ trợ XML nhưng việc tạo ra tập tin XML
vẫn còn bị lỗi do không thể tạo ra đúng cấu trúc mà người dùng mong đợi nếu như cấu trúc
XML đó phức tạp.
Kết luận: Mỗi mô hình giải pháp trên đều có ưu và nhược điểm khác nhau. Việc chọn lựa
mô hình nào sẽ tùy thuộc vào yêu cầu của từng ứng dụng. Nghĩa là ứng dụng của chúng ta
quan tâm đến vấn đề nào? Vấn đề nào là vấn đề được quan tâm hàng đầu thì lúc đó chúng ta
sẽ lựa chọn giải pháp lưu trữ dữ liệu cho phù hợp.
1.1.3. XML và cơ sở dữ liệu quan hệ
Mặc dù XML rất hiệu quả trong quá trình trao đổi, truy xuất trên Internet nhưng nó không
thể có được những tính năng tuyệt vời của cơ sở dữ liệu (CSDL) quan hệ như lưu trữ hiệu
quả với dung lượng cực lớn, sao chép dự phòng, phục hồi dữ liệu, tối ưu hệ thống Do đó,
nhu cầu chuyển đổi dữ liệu từ XML sang CSDL quan hệ là rất cần thiết khi lượng tải XML
ngày càng tăng.

thức trình bày dữ liệu. Một tài liệu XML sẽ chứa những đặc tả về cấu trúc dữ liệu.
Một tài liệu XML có các thành phần sau:
• Khai báo : Mỗi một tài liệu XML có một chỉ thị khai báo
• Chú thích : Được khai báo như sau:
• Phần tử (Elements): Một tài liệu XML được cấu thành từ những phần tử. Mỗi cấu trúc
gồm nhiều phần tử (element), mỗi phần tử được bắt đầu với một thẻ mở (start – tag) và
kết thúc với một thẻ đóng (end - tag). Giữa thử đóng và thẻ mở là nội dung của phần tử
này. Phần tử có thể chứa dữ liệu hoặc có thể lồng vào một phần tử khác
• Phần tử gốc (root) : Trong tài liệu XML, chỉ có một phần tử gốc, và phần tử này sẽ chứa
tất cả những phần tử của tài liệu XML do chúng ta tạo ra.
• Thuộc tính : Như đã trình bày ở trên, một phần tử có thể chứa dữ liệu hoặc chứa phần tử
khác hoặc cả hai. Bên cạnh đó, phần tử có thể rỗng, khi đó nó có thể chứa thuộc tính. Mỗi
thuộc tính chỉ là một sự lựa chọn để gắn dữ liệu đến phần tử. Một thuộc tính đặt trong thẻ
mở của phần tử và chỉ ra giá trị của nó bằng cách sử dụng cặp “name = value”.
7
Chúng tôi đã trình bày về các khái niệm cơ bản của XML cũng như một tài liệu XML. Đồng
thời giới thiệu về cấu trúc của một tài liệu XML. Vậy, câu hỏi được đặt ra là: sử dụng tài liệu
XML như thế nào? Và làm thế nào để truy cập đến một tập tin XML? Câu trả lời được trình
bày trong phần 2 và 3 của bài báo cáo.
2. Cách sử dụng một tài liệu XML trong môi trường Visual Studio
Tiếp theo, chúng tôi sẽ giới thiệu một số kỹ thuật được sử dụng trong môi trường Visual
Studio để làm việc với tập tin XML.
Môi trường Visual Studio hỗ trợ mô hình DOM (Document Object Module) để đọc và trình
bày nội dung của một tập tin XML. DOM biểu diễn một tài liệu XML trong một cấu trúc dữ
liệu dạng cây [4]. Một cây được tạo thành từ nhiều nút, mỗi nút cũng có thể chứa những nút
khác. Nút lá không có nút con, vì thế nút này dùng để thể hiện dữ liệu văn bản. Việc sử dụng
mô hình DOM sẽ thông qua một số đối tượng như XMLDocument, XMLDataDocument. Khi
một XMLDocument được tạo ra, nó tổ chức nội dung của một tập tin XML thành một cây.
Khi đã đọc được một tài liệu XML, cần định hướng qua tài liệu XML và chỉ lấy những dữ
liệu nào cần thiết cho ứng dụng của mình. Môi trường Visual Studio cung cấp lớp

3.1.2. Đường dẫn tương đối
Khi muốn trích một phần tử nào đó mà chỉ biết tên của phần tử này chứ không biết phần tử
này nằm ở vị trí nào thì có thể dung đường dẫn tương đối để thực hiện, bằng cách sử dụng
dấu // để chỉ cho trình phân tích biết đây là đường dẫn tương đối. Ví dụ, để trích các phần tử
có tên là Product chúng ta viết như sau:
- Cú pháp nguyên: //child::Product
- Cú pháp viết tắt: //Product
3.1.3. Chọn các phần tử bằng ký tự đại diện
Để chọn tất cả các phần tử con của một phần tử nào đó, có thể dung ký tự đại diện *. Ví dụ,
để lấy tất cả các phần tử con của phần tử Order ta viết như sau:
- Cú pháp nguyên: /child::Order/child::*
- Cú pháp tắt: /Order/*
3.1.4. Chọn các phần tử theo điều kiện
Để lấy các phần tử theo một điều kiện nào đó, sử dụng dấu ngoặc vuông ([ ]). Ví dụ, để lấy
những phần tử Item có phần tử con là Product và có thuộc tính ProductID=1 chúng ta viết
như sau:
- Cú pháp nguyên: //child::Item[child::Product/Attribute::ProductID=1]
- Cú pháp tắt: //Item[Product/@ProductID=1]
3.2. Ứng dụng vào bài toán quản lý thông tin sinh viên
Trong phần này, chúng tôi đã xây dựng một mô hình sử dụng xml database để quản lý thông
tin các sinh viên. Chương trình được lập trình trên môi trường Visual Studio và ngôn ngữ sử
dụng là C#.
Ở đây chúng tôi dùng XPath như là một công cụ để thực hiện các thao tác xử lý trên file xml
(xml database). Các thao tác chính chúng ta sẽ thực hiện mô phỏng đó là:
• Chèn một đối tượng vào cơ sở dữ liệu
• Tìm kiếm một đối tượng trong cơ sở dữ liệu
• Xoá một đối tượng trong cơ sở dữ liệu
• Thay đổi thông tin một đối tượng trong cơ sở dữ liệu.
Các thông tin sinh viên trong cơ sở dữ liệu chương trình gồm:
• MSSV

sinh viên. Có thể nhận thấy rằng XML có tính khả chuyển, mềm dẻo cao, dễ sử dụng do tổ
chức dữ liệu có cấu trúc và phân cấp. Tuy nhiên vẫn còn khá nhiều hạn chế khi áp dụng vào
bài toán quản lý thông tin sinh viên: Không phù hợp với những bài toán có cơ sở dữ liệu lớn.
5. Tài liệu tham khảo
[1]. />[2]. />[3]. Anders Møller, Michael I. Schwartzbach. An Introduction to XML and Web
Technologies. Addison-Wesley, 2006.
[4]. Bipin Joshi. Beginning XML with C# 2008: From Novice to Professional.Apress, 2008.
17


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status