Hãy khởi đầu nhanh chóng với DB2 9 pureXML,
Phần 2: Tạo và điền một cơ sở dữ liệu XML của
DB2
Tạo các đối tượng cơ sở dữ liệu
Để bắt đầu, hãy tạo một cơ sở dữ liệu Unicode duy nhất của DB2. (Với DB2 phiên bản V9.1, cần
có một cơ sở dữ liệu Unicode cho XML. DB2 phiên bản v9.5 và mới hơn không cần có một cơ
sở dữ liệu Unicode nữa). Sau đó, bạn sẽ tạo các đối tượng trong cơ sở dữ liệu này để quản lý cả
hai dữ liệu XML và các kiểu dữ liệu khác.
Tạo một cơ sở dữ liệu thử nghiệm
Để tạo ra một cơ sở dữ liệu thử nghiệm Unicode mới của DB2, hãy mở một cửa sổ lệnh DB2 và
đưa ra một câu lệnh quy định một bộ mã Unicode và vùng được hỗ trợ, như trong Liệt kê 1.
Liệt kê 1. Tạo một cơ sở dữ liệu để lưu trữ dữ liệu XML
create database test using codeset UTF-8 territory us
Một khi bạn tạo một cơ sở dữ liệu, bạn không cần phải phát hành bất kỳ các lệnh đặc biệt nào
hoặc thực hiện bất kỳ hoạt động thêm nào để cho phép DB2 lưu trữ dữ liệu XML theo định dạng
phân cấp nguyên gốc của nó. Hệ thống DB2 của bạn đã sẵn sàng để chạy.
Tạo các bảng mẫu
Để lưu trữ dữ liệu XML, bạn tạo ra các bảng có chứa một hoặc nhiều cột XML. Những bảng này
dùng như là các thùng chứa logic cho các bộ sưu tập các tài liệu. Sau hậu trường, DB2 thực sự sử
dụng một lược đồ lưu trữ khác cho dữ liệu XML và không-XML. Tuy nhiên, việc sử dụng các
bảng như một đối tượng logic để quản lý tất cả các dạng của dữ liệu được hỗ trợ làm đơn giản
hóa các vấn đề phát triển ứng dụng và quản trị, đặc biệt là khi cần tích hợp các dạng dữ liệu khác
nhau trong một truy vấn duy nhất.
Bạn có thể định nghĩa các bảng DB2 để chứa chỉ các cột XML, chỉ các cột theo các kiểu SQL
truyền thống hoặc kết hợp cả hai. Bài viết này mô hình hóa cái sau. Ví dụ trong Liệt kê 2 kết nối
đến cơ sở dữ liệu thử nghiệm và tạo ra hai bảng. Bảng đầu tiên là một bảng Items (Các mặt
hàng), theo dõi thông tin về các mặt hàng để bán và các ý kiến mà khách hàng đã đóng góp về
chúng. Bảng thứ hai theo dõi thông tin về Clients (Các khách hàng), bao gồm dữ liệu liên hệ.
Lưu ý rằng Comments và Contactinfo (Thông tin liên hệ) được dựa vào kiểu dữ liệu XML mới
Tùy chọn để lưu trữ nội tuyến (inline) các tài liệu XML nhỏ hơn đã được giới thiệu trong phiên
bản v9.5. Nếu các tài liệu XML đủ nhỏ để khớp với kích thước trang, thì nó có thể được lưu trữ
bằng các phần tử SQL khác. Nếu nó không đủ nhỏ để khớp với một trang, thì nó sẽ được lưu trữ
riêng biệt. Cùng với từ khoá nội tuyến, bạn cung cấp kích thước tối đa của XML được nội tuyến.
Giá trị này dựa vào vào kích thước trang và kích thước của các cột quan hệ khác. Liệt kê 3 cho
thấy đoạn mã thực hiện điều này:
Liệt kê 3. Tạo các bảng cho dữ liệu XML bằng tùy chọn nội tuyến
connect to test;
create table items (
id int primary key not null,
brandname varchar(30),
itemname varchar(30),
sku int,
srp decimal(7,2),
comments xml inline length 10240
);
Tạo các khung nhìn
Theo tùy chọn, bạn có thể tạo ra các khung nhìn trên các bảng đang chứa dữ liệu XML, cũng
giống như bạn có thể tạo các khung nhìn trên các bảng chỉ đang chứa các kiểu dữ liệu SQL
truyền thống. Ví dụ trong Liệt kê 4 tạo một khung nhìn của các khách hàng có một trạng thái
Gold (Vàng):
Liệt kê 4. Tạo một khung nhìn chứa dữ liệu XML
create view goldview as
select id, name, contactinfo
from clients where status='Gold';
Nhấn vào mũi tên màu xanh lá cây ở bên trái để thực hiện lệnh.
Trong trường hợp này, tài liệu đầu vào khá đơn giản. Nếu tài liệu lớn hay phức tạp, thì việc nhập
dữ liệu XML vào câu lệnh INSERT như đã hiển thị là không thực tế. Trong hầu hết các trường
hợp, bạn muốn viết một ứng dụng để chèn dữ liệu bằng một biến lưu trữ trên máy chủ hoặc một
dấu tham số. Bạn sẽ thấy một ví dụ mã hóa Java ngắn đi kèm theo bài viết này. Tuy nhiên,
hướng dẫn giới thiệu này không trình bày các chủ đề phát triển ứng dụng một cách chi tiết. Thay
vào đó, chúng ta sẽ bàn về tùy chọn khác để điền dữ liệu vào các cột XML của DB2 — khi sử
dụng phương tiện IMPORT.
Sử dụng phương tiện IMPORT của DB2
Nếu bạn đã có dữ liệu XML của mình trong các tệp, phương tiện IMPORT của DB2 cung cấp
một cách đơn giản để bạn điền dữ liệu này vào các bảng DB2 của bạn. Bạn không cần viết một
ứng dụng. Bạn chỉ cần tạo một tệp ASCII định giới có chứa dữ liệu mà bạn muốn nạp vào bảng
của mình. Đối với dữ liệu XML được lưu trữ trong các tệp, có một tham số xác định các tên tệp
thích hợp.
Bạn có thể tạo tệp ASCII định giới bằng cách sử dụng trình soạn thảo văn bản theo lựa chọn của
bạn. (Theo quy ước, các tệp như vậy thường là kiểu .del). Mỗi dòng trong tệp của bạn biểu diễn
một hàng dữ liệu được nhập khẩu vào bảng của bạn. Nếu dòng của bạn có chứa một XML Data
Specifier (XDS-Trình định rõ dữ liệu XML), thì IMPORT sẽ đọc dữ liệu được chứa trong tệp
XML tham chiếu và nhập khẩu dữ liệu đó vào DB2. Ví dụ, dòng đầu tiên trong Liệt kê 6 có
thông tin về Ella Kimpton, bao gồm mã định danh ID, tên và trạng thái khách hàng của cô ta.
Thông tin liên hệ của cô ta có trong tệp Client3227.xml.
Liệt kê 6. Tệp clients.del
3227,Ella Kimpton,Gold,<XDS FIL='Client3227.xml' />
8877,Chris Bontempo,Gold,<XDS FIL='Client8877.xml' />
9077,Lisa Hansen,Silver,*lt;XDS FIL='Client9077.xml' />
9177,Rita Gomez,Standard,<XDS FIL='Client9177.xml' />
5681,Paula Lipenski,Standard,<XDS FIL='Client5681.xml' />
4309,Tina Wang,Standard,<XDS FIL='Client4309.xml' />
Tệp items.del
3926,NatureTrail,Walking boot, 38112233,64.26,<XDS FIL='Comment3926.xml' />
4023,NatureTrail,Back pack,552238,34.99,<XDS FIL='Comment4023.xml' />
3641,Dress to Impress,Syutm7811421,149.99,
4272,Classy,Cocktail dress,981140,156.99,<XDS FIL='Comment4272.xml' />
Với các tệp XML và các tệp ASCII định giới có sẵn của mình, bây giờ bạn đã sẵn sàng sử dụng
phương tiện IMPORT của DB2. Câu lệnh trong Liệt kê 9 nhập khẩu các nội dung được quy định
trong tệp clients.del vào thư mục C:/XMLFILES trong bảng clients.
Liệt kê 9. Nhập khẩu dữ liệu vào bảng clients
import from clients.del of del xml from C:/XMLFILES insert into
user1.clients;
Tệp clients.del được chỉ ra trong Liệt kê 6 chứa dữ liệu cho sáu hàng, bao gồm các tham chiếu
đến sáu tệp XML. Việc thực hiện thành công một lệnh IMPORT dẫn đến kết quả tương tự như Liệt
kê 10.
Liệt kê 10. Kết quả mẫu của lệnh IMPORT của DB2
import from clients.del of del xml from C:/XMLFiles insert into
saracco.clients
SQL3109N The utility is beginning to load data from file "clients.del".
SQL3110N The utility has completed processing. "6" rows were read from the
input file.
SQL3221W Begin COMMIT WORK. Input Record Count = "6".
SQL3222W COMMIT of any database changes was successful.
tích hợp Java™.
Ví dụ, với IBM Rational® Application Developer (Nhà phát triển ứng dụng Rational của IBM)
hay IBM Rational Software Architect (Kiến trúc sư phần mềm của IBM), bạn có thể nhập khẩu
một tệp xml vào một dự án Web. Tệp xml được dùng trong ví dụ này được lấy từ bảng khách
hàng trong cơ sở dữ liệu mẫu của DB2. Nhấn chuột phải vào dự án và chọn Generate > XML
Schema. Việc này tạo ra một lược đồ XML hợp lệ cho tệp đầu vào riêng của bạn, như trong
Hình 2 (ảnh rộng hơn). Sau đó bạn có thể sửa đổi tệp (nếu cần) và đăng ký nó với DB2.
Hình 2. Sử dụng phần IBM Rational Software Architect để tạo ra một lược đồ XML từ một
tệp XML
Giả sử bạn cần tạo lược đồ XML khá linh hoạt của mình sao cho bạn có thể thu thập các kiểu
thông tin liên hệ với các khách hàng khác nhau. Ví dụ, một số khách hàng có thể cung cấp cho
bạn nhiều số điện thoại hoặc nhiều địa chỉ email, trong khi những người khác lại không thể.
Lược đồ XML được hiển thị trong Liệt kê Liệt kê 11, được bắt nguồn từ các lược đồ do IBM
Rational Software Architect đã tạo ra, có tính đến sự linh hoạt này. Nó bao gồm các đặc tả bổ
sung về số lượng các sự kiện tối thiểu và tối đa (minOccurs và maxOccurs) dành cho một phần
tử cụ thể. Trong trường hợp này, người ta không yêu cầu khách hàng cung cấp cho bạn bất kỳ
thông tin liên hệ nào mà bạn muốn thu thập. Tuy nhiên, nếu khách hàng lựa chọn cung cấp cho
bạn thông tin email, thì lược đồ này cho phép các tài liệu tuân thủ để chứa tối đa năm địa chỉ
email (có nghĩa là, năm giá trị của phần tử email).
Liệt kê 11. Lược đồ XML mẫu cho thông tin liên hệ khách hàng
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmins:xsd="
<xsd:element name="address">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="street" minOccurs="0"/>
<xsd:element ref="apt" minOccurs="0"/>
. . .
</xsd:schema>
Các lược đồ XML cũng chứa thông tin định kiểu. Lược đồ được hiển thị trong Liệt kê 11 quy
định rằng tất cả các phần tử cơ bản được coi là các chuỗi ký tự. Tuy nhiên, hầu hết các lược đồ
XML sản xuất lại sử dụng các loại dữ liệu khác, chẳng hạn như số nguyên, số thập phân, ngày
tháng và v.v Nếu bạn xác nhận hợp lệ các tài liệu XML dựa vào một lược đồ cụ thể như là một
phần của phép toán INSERT hay IMPORT của bạn, thì DB2 tự động thêm các chú thích định kiểu
cho các tài liệu XML của bạn.
Bước 2: Đăng ký lược đồ XML
Một khi bạn đã tạo ra một lược đồ XML thích hợp, bạn cần đăng ký lược đồ đó với DB2. IBM
cung cấp nhiều cách để làm điều này. Bạn có thể khởi chạy trình thủ thuật đồ họa từ DB2
Control Center để hướng dẫn bạn thực hiện thông qua quá trình này, gọi các thủ tục đã lưu do hệ
thống cung cấp hoặc ban hành trực tiếp các lệnh DB2. Đối với ví dụ này, hãy sử dụng phương
pháp sau, vì nó có thể giúp bạn dễ hiểu hơn những gì DB2 đang làm sau hậu trường thay cho
bạn.
Nếu lược đồ của bạn rất lớn, bạn có thể cần phải tăng kích thước vùng lưu trữ đặc biệt (heap) cho
ứng dụng của mình trước khi cố gắng đăng ký nó. Ví dụ, hãy ban hành các câu lệnh sau:
Liệt kê 12. Tăng kích thước vùng lưu trữ đặc biệt cho ứng dụng
connect to test;
update db cfg using applheapsz 10000;
Tiếp theo, hãy đăng ký lược đồ XML của bạn. Nếu lược đồ XML của bạn không tham chiếu các
lược đồ XML khác, bạn có thể đăng ký và hoàn thành quá trình này bằng một lệnh đơn. Nếu
không, bạn cần ban hành các lệnh riêng để đăng ký lược đồ XML chính của bạn, thêm vào các
lược đồ cần thiết khác và hoàn tất quá trình đăng ký. Khi một tài liệu lược đồ trở nên rất lớn,
thông thường cần chia nhỏ nội dung của nó thành nhiều tệp để cải thiện việc bảo trì, tính dễ đọc
và sử dụng lại. Điều này na ná như ngắt một ứng dụng hoặc thành phần phức tạp thành nhiều
mô-đun. Để biết chi tiết về chủ đề này, hãy tham khảo Nhập môn về Lược đồ XML của W3C.
XMLVALIDATE của phương tiện IMPORT của DB2. Câu lệnh trong Liệt kê 14 chỉ thị cho DB2 sử
dụng lược đồ XML đã đăng ký sẵn của bạn (user1.mysample) làm XDS mặc định (XML Data
Specifier) để xác nhận hợp lệ tệp XML được quy định trong tệp clients.del trước khi chèn chúng
vào bảng Clients.
Liệt kê 14. Nhập dữ liệu XML có xác nhận hợp lệ
import from clients.del of del xml from C:/XMLFILES xmlvalidate using xds
default
user1.mysample insert into user1.clients;
Nếu DB2 xác định rằng một tài liệu XML không tuân theo lược đồ đã quy định, thì toàn bộ hàng
liên kết với tài liệu đó bị loại. Liệt kê 15 minh họa đầu ra ví dụ từ một phép toán IMPORT trong
đó một hàng trong sáu hàng đã bị loại vì tài liệu XML của nó không phù hợp với lược đồ đã quy
định.
Liệt kê 15. Nhập dữ liệu XML có xác nhận hợp lệ
SQL3149N "6 rows were processed from the input file. "5" rows were
successfully inserted into the table. "1" rows were rejected.
Number of rows read = 6
Number of rows skipped = 0
Number of rows inserted = 5
Number of rows updated = 0
Number of rows rejected = 1
Number or rows committed = 6 Lưu ý rằng XMLVALIDATE cũng có thể được dùng với các câu lệnh INSERT để chỉ thị cho DB2 xác
nhận hợp lệ dữ liệu XML trước khi chèn nó. Cú pháp này tương tự như ví dụ IMPORT vừa được
hiển thị trong đó bạn quy định một lược đồ XML đã đăng ký (và đã hoàn thành) khi gọi mệnh đề