ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA CÔNG NGHỆ THÔNG TIN
Tel. (84-511) 3736 949, Fax. (84-511) 842 771
Website: itf.ud.edu.vn, E-mail:
LUẬN VĂN TỐT NGHIỆP KỸ SƯ
NGÀNH CÔNG NGHỆ THÔNG TIN
MÃ NGÀNH: 05115
ĐỀ TÀI:
XÂY DỰNG WEBSITE THƯ VIỆN ĐIỆN TỬ
Mã số: 04T4-001
Ngày bảo vệ: 16,17/06/2009
SINH VIÊN : NGUYỄN NHƯ BẢO
LỚP : 04T4
CBHD : Ts. NGUYỄN THANH BÌNH
ĐÀ NẴNG, 06/2009
LỜI CẢM ƠN
Luận văn tốt nghiệp đánh dấu bước ngoặt lớn trong mỗi cuộc đời sinh
viên; để hoàn thành tốt đề tài luận văn tốt nghiệp này, em đã nhận được sự
chỉ bảo, hướng dẫn tận tình từ phía các Thầy Cô giảng viên khoa Công
Nghệ Thông Tin trường Đại học Bách Khoa, Đại học Đà Nẵng; sự giúp đỡ
to lớn từ phía bạn bè đồng nghiệp và gia đình.
Đầu tiên, em xin cảm ơn tất cả các Thầy, Cô giảng viên của trường Đại
học Bách Khoa, Đại học Đà Nẵng - những người đã dạy dỗ, truyền đạt
kiến thức cho em trong suốt quãng thời gian em ngồi học trên ghế giảng
đường; những người đã làm tăng thêm trong em niềm yêu thích tin học.
Đặc biệt, em xin chân thành cảm ơn Thầy giáo Tiến sĩ Nguyễn Thanh Bình
đã định hướng, tận tình hướng dẫn góp ý để em có thể hoàn thành đúng
thời gian, đúng nội dung và đúng yêu cầu đặt ra của luận văn tốt nghiệp.
Thứ hai, em xin cảm ơn công ty Cổ phần giải pháp Tin học IFI-480
Trưng Nữ Vương-Đà Nẵng đã tạo mọi điều kiện để em hoàn thành tốt đợt
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
NHẬN XÉT CỦA CÁN BỘ DUYỆT
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.......................................................................................................................................................
.I Công cụ và môi trường phát triển.................................................................................35
.II Demo ứng dụng............................................................................................................35
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.....................................................47
[1] Trang web: />vin-truyn-thng-n-th-vin-s-lien-tc-va-t-pha..........................................................................49
[2] Trang web: />[3] Trang web Thư viện quốc gia Việt Nam
/>Dublin-Core-Metadata.html................................................................................................49
[4] Trần Đình Tú. “Xây dựng công cụ chuyển đổi XML sang CSDL quan hệ“. Báo cáo
tốt nghiệp Kỹ sư ngành CNTT, Đại học Bách Khoa, Đại học Đà Nẵng, Khóa 2005-200749
[5] Trần Hữu Hoàng, Công nghệ servlet. .......................................................................49
[6] Phan Phước Long, slide Giới thiệu về Flex Framework...........................................49
[7] Yakov Fain. Dr. Victor Rasputnis & Anatole Tartakovsk. Flex & Java, 735tr.......49
[8] Jack Herrington and Emily Kim. Getting Started with Flex 3. OREILLY , 148 tr..49
[9] Adobe Systems Incorporated. Flex 2 Programming Action Script 3.0. Adobe 2006,
524 tr....................................................................................................................................49
[10] Trang web : />[11] Trang web: ...........................................49
Nguyễn Như Bảo, Lớp 04T4 6
Website Thư viện điện tử
CÁC TỪ VIẾT TẮT
XML.................................................................................................Ngôn ngữ định dạng mở rộng
(eXtensible Makup Language)
CSDL.........................................................................................................................Cơ sở dữ liệu
(Database)
W3C................Tổ chức độc lập định ra tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ
(World Wide Web Consortium)
FDS.....................................................................................................................Flex Data Service
7
CHƯƠNG 1
MỞ ĐẦU
.I Giới thiệu bối cảnh đề tài
Thư viện xuất hiện từ khi loài người có nhu cầu cần lưu giữ thông tin. Ngày trước,
Website Thư viện điện tử
.III Nhiệm vụ phải thực hiện
.III.1. Mục tiêu nghiên cứu
Xây dựng cây mục tiêu như sau
Hình 1: Cây mục tiêu đề tài
9
Xây dựng website
Thư viện điện tử
Tìm hiểu kiến
trúc Cairngorm
Tìm hiểu nghiệp
vụ thư viện
Tìm hiểu cách
thức tổ chức, vận
hành website
Xây dựng ứng
dụng
Ngô
n
ngữ
Flex
Các
h
thức
tổ
chức
, cấu
trúc
file
Liên
dựng
tài
liệu
đặc
tả
C
o
d
i
n
g
Các
h
thức
hoạt
động
của
thư
viện
Ô này nghĩa là
gì ?
Website Thư viện điện tử
.IV Nhiệm vụ phải thực hiện
.IV.1. Mục tiêu nghiên cứu
Xây dựng cây mục tiêu như sau
Hình 1: Cây mục tiêu đề tài
10
Xây dựng website
Thư viện điện tử
Tìm hiểu kiến
hệ
Cách
thức tổ
chức
phân
cấp
theo
XML
Hoà
n
thiện
1
dem
o
Phân
tích
thiết kế
hướng
đối
tượng
Xây
dựng
tài
liệu
đặc
tả
C
o
d
i
11
CHƯƠNG 2
CƠ SỞ LÝ THUYẾT
.I Tổng quan về XML
.I.1. XML là gì?
XML là ngôn ngữ tạo cấu trúc dữ liệu văn bản được phát triển từ đầu năm 1996
dựa theo và tận dụng những điểm mạnh của chuẩn SGML (Standard Generalized
Markup Language: được coi như là siêu ngôn ngữ có khả năng sinh ngôn ngữ khác),
cùng những kinh nghiệm có được từ ngôn ngữ HTML (HyperText Markup
Language). SGML phát triển cho việc định cấu trúc và nội dung tài liệu điện tử do tổ
chức ISO (International Organization for Standardization) chuẩn hóa năm 1986.
SGML là do IBM đưa ra nhưng được phát triển bởi W3C (World Wide Web
Consortium: tổ chức độc lập định ra tiêu chuẩn cho định dạng Web, máy chủ và ngôn
ngữ), nhưng đặc tả XML lại do Netscape, Microsoft và các thành viên dự án Text
Encoding Intiative (TEI) xây dựng. Tổ chức W3C XML Special Interest Group có đại
diện từ hơn 100 công ty cùng nhiều chuyên gia được mời khác. W3C chính thức
thông qua chuẩn XML vào tháng 2/1998.
XML là một hệ thống có luật dùng cho việc thiết kế các khổ mẫu (format) cho văn
bản giúp tạo cấu trúc cho dữ liệu. Trong thực tế XML không phải là một ngôn ngữ
lập trình, XML giúp máy tính dễ dàng tạo dữ liệu, đọc dữ liệu, trao đổi dữ liệu và làm
cho cấu trúc dữ liệu trở nên rõ ràng và dễ hiểu hơn, ngoài ra XML còn có thể mở
rộng, có nền tảng hoàn toàn độc lập và hỗ trợ tính quốc tế hóa, nội địa hóa. XML hỗ
trợ hoàn toàn unicode.
.I.2. Đặc điểm của XML
XML cung cấp một phương tiện dùng văn bản (text) để mô tả thông tin và áp dụng
một cấu trúc kiểu cây cho thông tin đó. Cơ bản mọi thông tin đều thể hiện dưới dạng
văn bản, chen giữa là các thẻ đánh dấu (markup) với nhiệm vụ ký hiệu sự phân chia
thông tin thành một cấu trúc có thứ bậc của các dữ liệu ký tự, các phần tử dùng để
chứa dữ liệu, và các thuộc tính của các phần tử đó. Về mặt nào đó, XML tương tự với
các biểu thức S (S-expression) của ngôn ngữ lập trình LISP ở chỗ chúng đều mô tả
thuộc tính không mềm dẻo, chỉ có một tác dụng và nói chung là không thể dùng cho
mục đích khác.
XML không hạn chế về việc nó được sử dụng như thế nào. Mặc dù XML về cơ bản
là dạng văn bản, các phần mềm với chức năng trừu tượng hóa nó thành các định dạng
khác, giàu thông tin hơn đã nhanh chóng xuất hiện, quá trình trừu tượng hóa này
được thực hiện chủ yếu qua việc sử dụng các giản đồ định hướng kiểu dữ liệu
(datatype-oriented schema) và khuôn mẫu lập trình hướng đối tượng (mà trong đó,
mỗi tài liệu XML được thao tác như là một đối tượng). Những phần mềm như vậy có
thể coi XML như là dạng văn bản đã được tuần tự hóa chỉ khi nó cần truyền dữ liệu
qua mạng.
.I.3. Lược đồ XML
Để định nghĩa kiểu tài liệu cho XML, ngoài DTD ta còn dùng lược đồ (schema).
Một nhóm những nhà cung cấp kể cả Microsoft đã có kế hoạch đưa ra một sự (tiếp
cận thay thế DTD được gọi là lược đồ mà họ đã đệ trình lên W3C dưới dạng XML-
Data giống như một DTD, một lược đồ cung cấp những qui tắc của một tài liệu và chỉ
ra những nhãn nào được sử dụng, các thuộc tính của chúng là gì mối quan hệ giữa các
nhãn với nhau...
Tuy nhiên, khác với DTD một lược đồ có thể định nghĩa nên những kiểu dữ liệu.
Ví dụ: một DTD có thể có một nhãn được chỉ định dạng <PRLCE> nhưng nội dung
được chứa trong nhãn có thể là một số hoặc một chuỗi ký tự. Một lược đồ có thể bắt
13
Website Thư viện điện tử
buộc chúng ta phải nhập vào một số. Cách tiếp cận này rõ ràng có lợi đặc biệt đối với
việc trao đổi dữ liệu giữa các ứng dụng, các đối tượng hoặc những CSDL. Vấn đề đặt
ra duy nhất là liệu nó sẽ bị ảnh hưởng theo đặc điểm kỹ thuật của DTD hay kết quả là
một sự mở rộng riêng biệt đến XML.
− Mô hình cài đặt lược đồ XML theo Microsoft: là một tài liệu XML bắt đầu bằng
một phần tử <schema>. Lược đồ cho phép định nghĩa và khai báo kiểu dữ liệu thực sự
mà tài liệu sử dụng. Các kiểu dữ liệu dùng với không gian tên đối tượng đã được định
nghĩa sẵn. Để định nghĩa phần tử XML trong lược đồ ta dùng phần tử khai báo
<xsd:complexType> bên trong khai báo <xsd:element>, khi đó ta không cần gán
giá trị tường minh cho thuộc tính type trong <xsd:element>.
14
Website Thư viện điện tử
.I.4. XML và HTML
Trong thực tế bản thân ngôn ngữ XML có nguồn gốc giống như ngôn ngữ định
dạng siêu văn bản HTML (HyperText Markup Language) từ chuẩn ngôn ngữ định
dạng văn bản tổng quát có cấu trúc SGML. Mỗi văn bản XML cũng sử các thẻ (tags),
các từ được đặt trong ngoặc với ‘<’ và ‘>’ (mở và đóng) và dùng thuộc tính tên gọi
của các phần tử (element) với mẫu name= “value”.
Trong khi HTML đặc biệt chú ý tới từng thẻ (tag) và thuộc tính (attribute) có ý
nghĩa gì và phần văn bản giữa các thẻ đó hiển thị như thế nào trên trình duyệt thì
XML sử dụng các thẻ chỉ để phân định ranh giới giữa các đoạn dữ liệu và coi việc
đọc và xử lý dữ liệu hoàn toàn là nhiệm vụ của các ứng dụng. Nhưng khác với ngôn
ngữ HTML, số lượng và tên gọi các phần tử trong XML là không hạn chế.
XML là một văn bản nhưng không giống với những loại văn bản thông thường mà
ta có thể đọc được. Các chương trình dùng để tạo các dữ liệu được cấu trúc hóa thông
thường được lưu dữ liệu trên đĩa cứng, sử dụng khuôn dạng text hay nhị phân. Một
thuận lợi của khuôn dạng văn bản là cho phép người đọc có thể đọc nó với bất kỳ bộ
soạn thảo văn bản nào tùy thích. Các khuôn dạng văn bản cũng cho phép tìm lỗi dễ
dàng hơn trong các ứng dụng. Giống như HTML các file XML là những file văn bản
được tạo ra không phải với mục đích đề đọc, nhưng vẫn có thể đọc nếu thấy cần thiết.
Tuy nhiên XML có điểm không bằng HTML, các luật dùng trong XML rất hạn chế,
chỉ cần quên một thẻ, hay một thuộc tính không đi kèm với nội dung sẽ làm cho toàn
bộ file XML đó ngừng hoạt động, trong khi đó lỗi này ở file HTML có thể được bỏ
qua.
XML được xem như là ngôn ngữ mạnh hơn HTML do nó mang lại thông tin đầy
đủ về dữ liệu. XML cung cấp “siêu dữ liệu” metadata hay còn được gọi là “dữ liệu về
dữ liệu” (data about data). XML cho phép các nhà phát triển và quản trị công nghệ
thông tin mô tả thông tin có liên quan tới các nguồn thông tin khác. Đây là phương
thuộc tính của đối tượng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh
và tổ chức. Siêu dữ liệu còn có thể được định nghĩa là dữ liệu có cấu trúc về dữ liệu”.
Theo Gail Hodge siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả, giải thích,
định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý hơn. Siêu dữ
liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin”
Nói tóm lại thì siêu dữ liệu là thông tin mô tả tài nguyên thông tin.
Mục đích đầu tiên và yêu cầu cốt lõi nhất của siêu dữ liệu (metadata) là góp phần
mô tả và tìm lại các tài liệu điện tử trên mạng Internet. Sự phát triển mạnh mẽ của
Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng số, văn bản, âm
thanh, hình ảnh, tài liệu đa phương tiện. Những tài liệu này có thể truy cập được trên
mạng Internet song việc tìm kiếm chúng một cách hiệu quả và khoa học như với các
hệ thống thông tin trực tuyến là hết sức khó khăn. Để góp phần tăng cường chất
lượng tìm kiếm các tài liệu số trên mạng Internet, người ta đã đưa ra giải pháp sử
dụng siêu dữ liệu.
Thực ra trong hoạt động thông tin – thư viện truyền thống, từ lâu đã có những khái
niệm liên quan đến siêu dữ liệu. Các bản thư mục chứa các dữ liệu mô tả đối tượng
như cho sách , cho tạp chí thì chúng cũng được coi như là một dạng siêu dữ liệu. Với
việc tự động hóa công tác biên mục, phiếu thư mục được thay thế bằng biểu ghi thư
mục. Như vậy thành phần siêu dữ liệu còn có thể được trình bày trong biểu ghi, vì
16
Website Thư viện điện tử
vậy biểu ghi này được coi là biểu ghi siêu dữ liệu (metadata record) của đối tượng
được cơ sở dữ liệu quản lý. Với tài nguyên truyền thống trên giấy, thông tin mô tả
được bố trí nằm ngoài đối tượng mà nó mô tả (Ví dụ, trên phiếu thư mục của mục lục
thư viện, trong biểu ghi của CSDL). Nhờ những yếu tố mô tả như vậy, người ta có thể
xác định và tìm kiếm lại được tài liệu một cách chính xác theo một vài yếu tố.
Ngày nay, nguồn tài liệu điện tử phát triển nhanh chóng và sự phân tán trên mạng
nhiều đến mức không thể xử lý được một cách thủ công như đã và đang áp dụng đối
với tài liệu xuất bản trên giấy. Để xử lý được hết tài liệu điện tử phân tán, người ta
phải áp dụng các phương pháp tự động – sử dụng các chương trình đặc biệt (được gọi
nguyên hoặc liên kết với tài nguyên mà nó mô tả như trong trường hợp các thẻ meta
17
Website Thư viện điện tử
của tài liệu HTML hoặc các tiêu đề TEI (Text Encoding Initiative – TEI header:
tham khảo: trong tài liệu điện tử.
Trong thực tế có nhiều chuẩn mô tả biên mục mang tính chất metadata khá thông
dụng đang được áp dụng như: MARC21/UNIMARC, ISO-2709, Dublin Core
Metadata... các dữ liệu metadata này thường được gắn vào phần đầu cho mỗi tài liệu
điện tử được đưa vào máy chủ hoặc trên mạng internet nhằm hỗ trợ các công cụ tìm
kiếm lọc ra các thông tin metadata để tổ chức thành các kho dữ liệu mà không cần
dùng đến hệ quản trị cơ sở dữ liệu truyền thống. Thực tế thì ngay bản thân ngôn ngữ
XML tự nó đã hỗ trợ việc hình thành một cơ sở dữ liệu toàn văn, phi cấu trúc và rất
thuận lợi cho việc tìm kiếm và trao đổi thông tin.
.III Tổng quan về thư viện số
.III.1. Thư viện số là gì?
Peter Noerr (1998) định nghĩa thư viện số là một thư viện mà “có tài nguyên được
lưu trữ trong hệ thống máy tính dưới một định dạng cho phép nó có thể được điều
chỉnh (ví dụ để cải thiện khả năng khai thác) và cấp phát (ví dụ như một tệp âm thanh
để nghe trên máy tính) theo những cách thức mà những phiên bản thông thường của
tài nguyên này không thể thực hiện được.”
Theo định nghĩa của Witten và BainBridge (2003) thì, thư viện số không thực sự
nghĩa là “một thư viện được số hóa... Thư viện số đề cập tới những cách thức mới để
làm việc với tri thức : bảo quản, sưu tập, tổ chức, nhân bản và truy cập – chứ không
phải là việc phá bỏ những tổ chức thư viện hiện có và đặt chúng lại với nhau trong
chiếc hộp điện tử.”
“Thư viện số là những tổ chức cung cấp những tài nguyên, và kèm theo đó là
những nhân viên chuyên biệt, để lựa chọn, định cấu trúc, cung cấp khả năng truy cập
mang tính trí tuệ, diễn dịch phân phối, bảo quản tính toàn vẹn, và đảm bảo tính bền
vững theo thời gian của những bộ sưu tập các tác phẩm số sao cho chúng luôn sẵn
sàng để một cộng đồng hoặc một nhóm cộng đồng được xác định trước có thể sử