Tiểu luận môn cơ sở dữ liệu nâng cao Biểu diễn các phát biểu bằng đồ thị RDF - Pdf 26

Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
MỤC LỤC
I. Tổng quan về cơ sở dữ liệu đồ thị 2
II.Tổng quan về RDF 4
III.Kết luận 25
Tài liệu tham khảo 26
MỞ ĐẦU
Ngày nay, cơ sở dữ liệu đồ thị đã trở thành thế mạnh trong nhiều lĩnh vực, bởi hầu hết
các ứng dụng đều có một lượng dữ liệu khổng lồ và đòi hỏi phải có tính linh hoạt mềm dẻo
để thay đổi cấu trúc dữ liệu theo thời gian cho phù hợp với nhu cầu thực tế.
Và Dữ liệu đồ thị đã đáp ứng được nhu cầu này bằng cách thức lưu trữ thông tin ở dạng
đồ thị những đỉnh và cạnh.
Bài báo cáo này trình bày khái quát và cách tiếp cận RDF bằng cơ sở dữ liệu đồ thị.
Cài đặt RDF với giao diện đơn giản, cho phép người dùng tìm kiếm thông tin trong cấu
trúc RDF.
Em xin chân thành cảm ơn PGS.TS. Đỗ Phúc đã tận tình giảng dạy, truyền đạt những
kiến thức quý báu và hướng dẫn về nguồn tài liệu tham khảo để em có thể hoàn thành môn
học này.
Em xin chân thành cám ơn!
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 1
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
I. Tổng quan về cơ sở dữ liệu đồ thị
1. Lý thuyết về đồ thị:
Một đồ thị G là một bộ gồm ba thành phần <N,E,W> trong đó N={ni} là một tập các
nút, là tập các cạnh, mỗi cạnh gồm cặp các nút <ni,nj> và W là một ánh xạ E->R
n
tương ứng với một trọng số hay giá trị của mỗi cạnh.
Trọng số được định nghĩa như là một vector số thực bởi vì trong thực tế giá trị thuộc tính
của các cạnh là khá phức tạp.
Một đồ thị có các cạnh có hướng, hướng từ đỉnh nguồn đến đỉnh đích thì gọi là đồ thị có

tả và trao đổi thông tin.
• Để làm được điều này thì RDF sử dụng 1 mô hình dữ liệu đơn giản, trong đó gồm :
các tài nguyên (resources) và các phát biểu (statements).
• Một phát biểu liên kết hai tài nguyên với nhau. Một phát biểu giống như 1 câu đơn
giản có dạng: chủ ngữ(subject)-động từ(verb)-vị ngữ(object) .VD : "I love you" thì "
I " là chủ ngữ, " love " là động từ, " you " là vị ngữ.
• Trong RDF, một phát biểu được gọi là một bộ ba, vì nó gồm 3 phần :
o Chủ ngữ của phát biểu được gọi là subject
o Động từ được gọi là predicate hoặc property
o Vị ngữ thì được gọi là object hoặc value
2. RDF và các cơ sở dữ liệu truyền thống
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 4
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
• Trong cơ sở dữ liệu truyền thống, dữ liệu được lưu dưới dạng bảng. Trong đó mỗi bộ
dữ liệu (tuple) không giới hạn về số lượng thành phần.
• Ví dụ :
PersonID Name Phone Email City State
person-1 William Sparks 435 555-6789 [email protected] Springfield MA
person-2 Constance Sim 312 555-2238 [email protected] Chicago IL
• Do RDF chỉ gồm các tài nguyên và các bộ ba, nên để đưa dữ liệu về dạng các bộ ba,
cần tách cơ sở dữ liệu truyền thống thành các bảng nhỏ nhất có thể. Một hàng của
một bảng gồm hai cột có thể coi là 1 bộ ba nên ta có thể tách bảng cũ thành tập các
bảng 2 cột như sau :
PersonID Name
person-1 William Sparks
person-2 Constance Sim
Ta có bộ ba : (person-1, name, William Sparks)
Name Phone
William Sparks 435 555-6789

không định danh(nút vô danh), tài nguyên này lại là chủ ngữ của hai phát biểu khác. Bây
giờ ta sẽ thêm một thuộc tính nữa cho nút trống này để xác định kiểu cho tài nguyên đó.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 7
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 6 : Tạo kiểu cho nút vô danh
Tài nguyên là vị ngữ của phát biểu
• Ví dụ, ta muốn tạo một phát biểu về tài khoản email của person-1. Giả sử, nó được
mở tạo vào August 1, 2001. Ta muốn tạo một bộ ba với địa chỉ email là chủ ngữ
(subject) nhưng không thể vì chủ ngữ phải là tài nguyên chứ không phải là kí tự.
• Tùy từng trường hợp ta có thể sử dụng một nút vô danh hoặc tạo 1 nút mới. Hình
dưới dùng cách tạo một nút mới. Việc này có vẻ đơn giản nhưng nó đã đưa ra một
hướng xử lý mới trong RDF.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 8
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 7 : Thêm một nút mới để email có thể là chủ ngữ của các phát biểu khác
Một số nút đặc biệt
• Có nhiều trường hợp chúng ta muốn nói về một tài nguyên mà bản thân nó là một tập
hợp gồm nhiều tài nguyên khác. Mô hình RDF có định nghĩa ba kiểu tài nguyên đặc
biệt để hỗ trợ những trường hợp này :
o Bag: chứa đựng tập tài nguyên không cần thứ tự
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 9
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 8 : Một tập hợp của phương tiện giao thông
• Sequence : chứa đựng tập tài nguyên có thứ tự.
• Alternative : chứa đựng các lựa chọn cho một tài nguyên.
Hình 9 : Nút alternative - biểu diễn các lựa chọn - đèn có thể tắt hoặc mở
4. Chia sẻ dữ liệu

bản XML là một RDF. Trong thành phần này sẽ chứa một tham chiếu đến namspace RDF
Ví dụ:
<?xml version="1.0"?>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 11
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
Mô tả các tài nguyên ở đây
</rdf:RDF>
4.3.2 Thành phần <rdf:Description>
Thành phần <rdf:Description> nhận biết tài nguyên bằng một thuộc tính about. Thành
phần này chứa những thành phần mô tả về tài nguyên
Ví dụ:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cd="http://www.recshop.fake/cd#">
<rdf:Description
rdf:about="http://www.recshop.fake/cd/Empire Burlesque">
<cd:artist>Bob Dylan</cd:artist>
<cd:country>USA</cd:country>
<cd:company>Columbia</cd:company>
<cd:price>10.90</cd:price>
<cd:year>1985</cd:year>
</rdf:Description>
</rdf:RDF>
* Những thành phần artist, country, company, price, and year được định nghĩa trong
namespace
HVTH: Vương Thị Ngọc Ẩn- CH1101063

rdf:about="http://www.recshop.fake/cd/Empire Burlesque">
<cd:artist rdf:resource="http://www.recshop.fake/cd/dylan" /></rdf:Description>
</rdf:RDF>
4.4. Thành phần RDF Container
RDF Container được sử dụng để mô tả một nhóm các tài nguyên.
4.4.1 Thành phần <rdf:Bag>
Thành phần <rdf:Bag> chứa danh sách những giá trị không có thứ tự cụ thể và có thể
chứa những giá trị trùng nhau.
Ví dụ:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cd="http://www.recshop.fake/cd#">
<rdf:Description
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 14
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
rdf:about="http://www.recshop.fake/cd/Beatles">
<cd:artist>
<rdf:Bag>
<rdf:li>John</rdf:li>
<rdf:li>Paul</rdf:li>
<rdf:li>George</rdf:li>
<rdf:li>Ringo</rdf:li>
</rdf:Bag>
</cd:artist>
</rdf:Description>

<rdf:Description
rdf:about="http://www.recshop.fake/cd/Beatles">
<cd:format>
<rdf:Alt>
<rdf:li>CD</rdf:li>
<rdf:li>Record</rdf:li>
<rdf:li>Tape</rdf:li>
</rdf:Alt>
</cd:format>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 16
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
</rdf:Description>
</rdf:RDF>
4.5 RDF Collections
Những giá trị chứa trong container còn được gọi là các member.
RDF Collection mô tả các nhóm mà chỉ chứa các member cụ thể.
Một collection có thể được mô tả bởi thuộc tính rdf:parseType="Collection".
Ví dụ về RDF Collection:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cd="http://recshop.fake/cd#">
<rdf:Description
rdf:about="http://recshop.fake/cd/Beatles">
<cd:artist rdf:parseType="Collection">
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/George"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/John"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Paul"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Ringo"/>

<doap:homepage rdf:resource="http://razor.occams.info/code/semweb"/>
<doap:created>2005-04-20</doap:created>
<doap:description>A library for semantic web and RDF data manipulation written in
C# for .NET applications.</doap:description>
<doap:maintainer>
<foaf:Person>
<foaf:name>Joshua Tauberer</foaf:name>
</foaf:Person>
</doap:maintainer>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 19
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<doap:release>
<doap:Version>
<doap:revision>1.01</doap:revision>
</doap:Version>
</doap:release>
</doap:Project>
</rdf:RDF>
Đây là một tài liệu RDF về dự án có tên là SemWeb RDF Library for C#/.NET.
RDF này bao gồm nhiều thành phần, mỗi thành phần tạo nên một statement.
Đối với các thành phần <doap:name>, <doap:shortname>, <doap:homepage>,
<doap:created>, <doap:description> ta có các phát biểu về statement như sau:
Dự án semweb có name là SemWeb RDF Library for C#/.NET
có shortname là SemWeb Library for .NET
có homepage là http://razor.occams.info/code/semweb
Được tạo vào ngày 2005-04-20
Dự án semweb có description là A library for semantic web and RDF data manipulation
written in C# for .NET applications.
Đối với thành phần <doap:maintainer> và <doap:release> chứa một nhóm các thành

Hình 11: RelationShip
6. Cài đặt và Demo
* Chương trình demo được thực hiện qua 4 giai đoạn:
Đọc nội dung tài liệu RDF
Chuyển nội dung tài liệu RDF qua bộ parser để tạo ra các statement
Từ các statement tạo ra các nút và cạnh đồ thị
Lưu các nút và cạnh đồ thị vào database.
• Hướng dẫn cài đặt và sử dụng chương trình
Để cài đặt và sử dụng chương trình demo thì người dùng cần cài hệ quản trị cơ sở dữ
liệu Microsoft SQL Server 2005 hoặc mới hơn
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 22
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
- Sau đây là một số lưu ý khi cài đặt MS SQL Server 2005.
Ở màn hình Registration Information bỏ chọn Hide advanced configuration options nếu
ta muốn cài đặt các chức năng nâng cao của SQL Server 2005.
Chỉ định tên server cho MS SQL Server 2005 ở màn hình Instance Name. Lưu ý tên server này
sẽ được sử dụng khi đăng nhập vào chương trình.
Chọn Use a domain User Account và chỉ định user name, password ở màn hình Service
Account.
Chương trình chạy trên nền .Net Framework 3.5 nên người dùng cần phải cài đặt .Net
Framework 3.5.
• Cài đặt và sử dụng chương trình
Chương trình được đóng gói thành tập tin exe.
Người dùng có thể click setup và theo hướng dẫn cài đặt cho đến khi hoàn tất.
Sau khi kết thúc cài đặt, ta khởi động chương trình bằng cách double click vào biểu tượng
chương trình trên desktop. Người dùng sẽ được yêu cầu đăng nhập để kết nối với máy chủ SQL
Server. Ta điền thông tin tên máy chủ SQL Server, User name và Password mà ta đã nhập vào lúc
cài đặt MS SQL Server.
Tên server phải theo hình thức tên domain. Tức là gồm tên hoặc ip máy chủ + “\” + tên SQL


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status