Chương 4. XML
4 - 1/
CHƯƠNG 4
XML
CƠ SỞ DỮ LIỆU WEB & XML
Chương 4. XML
4 - 2/
4.1 Tổng quan về XML
4.2 Định nghĩa kiểu dữ liệu - DTD
4.3 Ngôn ngữ định dạng
4.4 Liên kết
Chương 4: XML
Chương 4. XML
4 - 3/
MỤC TIÊU
- Trình bày được:
+ Các khái niệm trong XML
+ Định nghĩa kiểu tư liệu - DTD
+ Ngôn ngữ định dạng dữ liệu
+ Ngôn ngữ tạo liên kết
- Tạo được tài liệu XML hợp lệ, hợp khuôn dạng
- Áp dụng để tạo cấu trúc tài liệu
Chương 4: XML
Chương 4. XML
4 - 4/
4.1.1 Giới thiệu
XML - eXtensible Markup Language
là ngôn ngữ xây dựng cấu trúc tài liệu văn bản
dựa theo chuẩn SGML (Standard Generalized Markup
<?xml version="1.0" encoding="UTF-8"?>
<book isbn="978-1594489501">
<title> A Thousand Splendid Suns </title>
<author> Khaled Hosseini </author>
<publisher> Riverhead Hardcover </publisher>
<amazon_price> 14.27 </amazon_price>
</book>
4.1 Tổng quan về XML
Chương 4. XML
4 - 8/
4.1.1 Giới thiệu
Các đặc điểm của XML:
Dễ dàng viết được các chương trình xử lý dữ liệu
Tài liệu XML dễ đọc và có tính hợp lý cao
XML dễ dàng được sử dụng trên Internet
XML hỗ trợ nhiều ứng dụng
Không đặt nặng tính hình thức trong nội dung thẻ
4.1 Tổng quan về XML
Chương 4. XML
4 - 9/
4.1.2 Cấu trúc một tài liệu XML
Một tài liệu XML được chia thành hai phần chính:
-
Phần khai báo: khai báo cho tài liệu XML
khai báo phiên bản, bảng mã ký tự sử dụng trong tài liệu
định nghĩa kiểu cho tài liệu
Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu:
các khai báo đặt tại dòng đầu tiên của tài liệu
chỉ có một thành phần gốc (root)
mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ
Các thành phần đều nằm giữa cặp thẻ gốc và phải lồng
nhau một cách hợp lý
các cặp thẻ phải được viết chính xác như nhau
giá trị của thuộc tính phải nằm giữa ngoặc kép hoặc đơn
4.1 Tổng quan về XML
Chương 4. XML
4 - 13/
4.1.2 Cấu trúc một tài liệu XML
- Phần tử gốc
chứa tất cả các phần tử trong văn bản
:
<?xml version="1.0"?>
<greeting>
Hello, World!
</greeting>
<greeting>
Hello XML!
</greeting>
<?xml version="1.0"?>
<greetings>
<greeting>
Giá trị của thuộc tính phải được đặt trong cặp nháy đơn
hoặc nháy kép
mỗi tên thuộc tính chỉ được xuất hiện một lần trong mỗi
phần tử.
4.1 Tổng quan về XML
Chương 4. XML
4 - 16/
4.1.2 Cấu trúc một tài liệu XML
- Phần tử
Để gán giá trị cho thuộc tính, thường dùng dấu “=”. Ví dụ
city = "Bedford".
Ví dụ:
<?xml version="1.0" encoding="UTF-8"?>
<book isbn="978-1594489501">
<title> A Thousand Splendid Suns </title>
<author> Khaled Hosseini </author>
</book>
4.1 Tổng quan về XML
Chương 4. XML
4 - 17/
4.1.2 Cấu trúc một tài liệu XML
- Phần tử rỗng
là phần tử không kèm theo dữ liệu
chỉ có duy nhất một thẻ.
chỉ cần thẻ bắt đầu, không cần thẻ kết thúc.
Ký hiệu thẻ <…/>
tất cả thông tin được lưu trữ trong các thuộc tính.
4.1 Tổng quan về XML
4 - 20/
4.1.2 Cấu trúc một tài liệu XML
- Quy tắc đặt tên phần tử
bắt đầu bằng các ký tự hay dấu ”_”, không được bắt đầu
bằng số hay dấu câu
sau ký tự đầu tiên, có thể dùng số, “-“ và “.”
không được chứa khoảng trống, dấu hai chấm “:”
không được bắt đầu bởi nhóm ký tự “xml”
không được chứa ký tự trống ngay sau dấu mở “<”, nhưng
có thể chứa ký tự trống ngay trước dấu đóng “>”
4.1 Tổng quan về XML
Chương 4. XML
4 - 21/
4.1.2 Cấu trúc một tài liệu XML
Ví dụ: đặc tả thông tin về Jane
<?xml version = “1.0” encoding = “UTF-8”?>
<label>
<name> Jane Smith </name>
<address
street = "270 Burlington Road"
city = "Bedford"
state = "MA 01730" />
</label>
4.1 Tổng quan về XML
Chương 4. XML
4 - 22/
4.1.2 Cấu trúc một tài liệu XML
- Chú thích:
4.1 Tổng quan về XML
Chương 4. XML
4 - 25/
4.1.3 Tài liệu XML hợp khuôn dạng, hợp lệ
- Để hợp khuôn dạng, tài liệu XML phải đúng các luật sau đây:
Có một phần tử gốc duy nhất, chứa tất cả phần tử khác
Mỗi thẻ mở phải có một thẻ đóng giống như nó
Mỗi phần tử con nằm trọn bên trong phần tử cha của nó
Giá trị thuộc tính trong XML phải được đặt giữa một cặp
ngoặc kép hay một cặp ngoặc đơn.
4.1 Tổng quan về XML