Thực Trạng Nghiên Cứu Và Giảng Dạy Và Ứng Dụng Phần Mềm Mã Nguồn Mở Greenstone Tại Việt Nam - Pdf 41

MỤC LỤC
LỜI CẢM ƠN…………………………………………………………..3
DANH MỤC VIẾT TẮT……………………………………………….4
MỞ ĐẦU
1. Tính cấp thiết của đề tài…………………………………………5
2. Mục đích nghiên cứu…………………………………………….6
3. Đối tượng và phạm vi nghiên cứu……………………………….7
4. Phương pháp nghiên cứu ………………………………………..7
5. Bố cục khoá luận ………………………………………………..7
CHƯƠNG 1. TỔNG QUAN VỀ MÃ NGUỒN MỞ GREENSTONE...8
1.1. Một số khái niệm liên quan đến nguồn mở Greenstone …..8









1.1.1. Thư viện số ………………………………………..8
1.1.2 Phần mềm mã nguồn mở (open source/open code)…9
1.1.3 Bộ sưu tập (collection)……… ……………………..10
1.1.4 Siêu dữ liệu (Medata) ……………………………...10
1.1.5. Plugin……………………………………………… 15
1.1.6 Classifier ( Phân Loại) …………………………….. 16
1.1.7 Duyệt tài liệu (Browser) ……………………………20
1.1.8 Tìm kiếm (Search) ………………………………….21

1.2. Bối cảnh đời của phần mềm mã nguồn mở Greenstone…….22
1.3.Tình hình ứng dụng mã nguồn mở Greenstone trên thế giới hiện

2.2.6. Trung tâm học liệu – Đại học Thái Nguyên...66

Chương 3 : NHẬN XÉT VÀ KIẾN NGHỊ………………………….....72
3.1.Nhận xét: …………………………………………………....72
• 3.1.1 Nhận xét về tính năng và đặc điểm của phần mềm
……………………………………………………..72
• 3.1.2 Nhận xét về việc triển khai ứng dụng Greenstone ở
Việt Nam…………………………………………..73
• 3.1.3 Nhận xét về kết quả của việc nghiên cứu và giảng
dạy nguồn mở Greenstone ở Việt Nam………….....75
3.2 Kiến nghị………………………………………………….....76
KẾT LUẬN …………………………………………………………....78
DANH MỤC TÀI LIỆU THAM KHẢO……………………………....80
LỜI CẢM ƠN
Để hoàn thành được khóa luận tốt nghiệp này, tôi xin chân thành cảm ơn
Cô giáo hướng dẫn, Th.S Nguyễn Thị Trang Nhung đã trực tiếp hướn2g dẫn tôi
trong suốt thời gian thực hiện đề tài.

2


Tôi cũng xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Thư viện –
Thông tin đã tận tình giảng dạy và trang bị cho chúng tôi những kiến thức cần
thiết, quý báu trong suốt những năm học tại trường.
Xin cảm ơn chân thành tới gia đình, bạn bè đã động viên, giúp đỡ tôi hoàn thành
Khóa luận này.
Mặc dù tôi đã hoàn thành khóa luận với tất cả nỗ lực của bản thân, nhưng
do chưa có kinh nghiệm trong việc nghiên cứu khoa học cũng như hạn chế về
trình độ hiểu biết nên khóa luận không thể tránh khỏi thiếu sót nhất định về mặt
nội dung và hình thức trình bày. Kính mong nhận được sự cảm thông và chỉ bảo


United Nations Educational, Scientific, and Cultural
Organization

GLI:

Greenstone Librarian Interface

DLF:

Digital Libraries Federation (Liên doàn thư viện số thế
giới)

GNU

General Public License

FOSS

Free/Open Source Software

PMMN

phần mềm nguồn mở

MỞ ĐẦU
1. Tính cấp thiết của đề tài.
Sự phát triển như vũ bão của công nghệ thông tin mang đến nhiều cơ hội
và thách thức cho các ngành nghề trong xã hội, trong đó có ngành thư viện –
thông tin. Chính sự thay đổi nhanh chóng này đã và đang dẫn đến sự bùng nổ

5


công nghệ thông tin vào thư viện chưa cao và đầu tư cho các thư viện chưa lớn
thì việc lựa chọn phần mềm nguồn mở để xây dựng các bộ sưu tập số hóa làm
cơ sở cho xây dựng thư viện số là một lựa chọn hợp lý. Greenstone là một trong
những phần mềm mã nguồn mở miễn phí có thể tích hợp vào các phần mềm thư
viện có sẵn và cho phép các thư viện có thể chỉnh sửa để phù hợp với yêu cầu
và mục đích của thư viện. Thư viện Trường Đại học Khoa học Tự nhiên Thành
phố Hồ Chí Minh (ĐHKHTN TP. HCM) là cơ quan đi đầu sử dụng phần mềm
Greenstone và hợp tác với một nhóm chuyên gia công nghệ thông tin để chuyển
đổi phần mềm này sang tiếng Việt có tên gọi là HÒN ĐÁ XANH (2004). Tiếp
đó thư viện Đại học Ngân hàng Thành phố Hồ Chí Minh (ĐHNH TP. HCM) và
một số thư viện khác cũng đã ứng dụng phần mềm này để xây dựng các bộ sưu
tập số cho thư viện mình. Để tìm hiểu kỹ hơn về các tính năng của phần mềm
nguồn mở Greenstone trong việc xây dựng và phát triển thư viện số tôi đã chọn
đề tài “Phần mềm nguồn mở Greenstone và tình hình ứng dụng tại Việt Nam”
làm đề tài khóa luận.
2. Mục đích nghiên cứu
Mục đích nghiên cứu của đề tài là tìm hiểu về phần mềm nguồn mở thư
viện số - Greenstone, phân tích những đặc điểm nổi bật của phần mềm này
trong việc ứng dựng vào hoạt động thư viện. Khảo sát về cách tổ chức, quản lý
và khai thác bộ sưu tập số của một số thư viện đã ứng dụng Greenstone tại Việt
Nam để làm rõ những tính năng và ứng dụng của phần mềm này. Tác giả sẽ đưa
ra những đề xuất, kiến nghị với mong muốn giới thiệu phần mềm này rộng rãi
hơn đến các thư viện nhằm nâng cao hiệu quả hoạt động, đặc biệt là xây dựng
và phát triển bộ sưu tập số của hệ thống thư viện trong cả nước.
3. Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu của khóa luận là phần mềm nguồn mở thư viện sốGreenstone và thực trạng ứng dụng phần mềm này tại Việt Nam.


máy tính số, các thiết bị máy móc lưu trữ và trao đổi thông tin cùng với bối
cảnh và phần mềm cần thiết để sản xuất và cung cấp các dịch vụ thông tin thư
viện tương tự như các thư viện truyền thống vẫn làm đối với tài liệu giấy và các
loại hình tài liệu truyền thống khác trong qua trình thu thập, biên mục, tìm kiếm
và phố biến thông tin… Một thư viện số đúng nghĩa và hoàn chỉnh phải bao
gồm tất cả các dịch vụ cơ bản của các thư viện truyền thống đồng thời tận dụng
được các lợi thế của việc lưu trữ, tìm kiếm và cung cấp thông tin số hoá”
Theo định nghĩa của Liên đoàn Thư viện số (1993): “ thư viện số là các tổ
chức cung cấp các nguồn lực tài nguyên, bao gồm cả các chuyên gia để lựa
chọn, cấu trúc, cung cấp khả năng truy cập tới các nguồn tri thức, phân phối,
bảo đảm tính vẹn toàn và tính lâu dài của các bộ sưu tập số để cho một cộng
đồng hoặc một tập hợp cộng đồng người dùng tin xác nhận luôn có thể sử dụng
một cách nhanh chóng kịp thời và kinh tế.
Theo Micheal Lest (1997): “ thư viện số là các bộ sưu tập thông tin số
hóa được tổ chức. Chúng bao gồm việc cấu trúc và thu thập thông tin là các
công việc mà các thư viện truyền thống vẫn luôn phải làm và các máy tính có
nhiệm vụ trình bày các thông tin số đó. Một thư viện số thực sự cũng tạo ra các
nguyên tắc quản lý những yếu tố đó cấu thành thư viện và các phương thức tổ
chức thư viện”.
Theo Liên đoàn Thư viện số Hoa kỳ (1999): “thư viện số là cơ quan, tổ
chức có các nguồn nhân lực chuyên hóa, để lựa chọn cấu trúc việc truy cập đến
8


diễn giải, phổ biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian
dài của sưu tập các công trình số hóa mà chúng ở dạng sẵn sàng để sử dụng một
cách kinh tế cho một hoặc một số cộng đông nhất định
Theo Witten và Bainbridge (2003): “thư viện số là bộ sưu tập thông tin
một cách có tổ chức, là tập hợp các đối tượng dữ liệu số mang tính tập trung,
gồm có văn bản, video, âm thanh, cùng với những phương thức để truy cập,

Một bộ sưu tập thông tin bao gồm nhiều tài liệu dưới nhiều dạng thức
khác nhau: văn bản, âm thanh, hình ảnh, tuy nhiên cung cấp một giao diện đồng
nhất qua đó tất cả các tài liệu có thể được truy cập, mặc dù cách mà tài liệu đó
hiển thị sẽ tùy thuộc vào phương tiện và dạng thức của tài liệu đó.
Một thư viện bao gồm nhiều bộ sưu tập. Mỗi sưu tập được tổ chức theo
hình thức khác nhau tùy nội dung tài liệu được sưu tầm và tùy theo chủ đề được
quan tâm. Tuy nhiên cách thức xây dựng và hiển thị các bộ sưu tập là hoàn toàn
giống nhau. Bộ sưu tập có thể xem là đơn vị của một thư viện số Greenstone.
1.1.4 Siêu dữ liệu (Medata)
Siêu dữ liệu là dữ liệu đi kèm với đối tượng thông tin và nó cho phép
những người sử dụng tiềm năng có thể biết trước sự tồn tại cũng như đặc điểm
của đối tượng thông tin này [20, tr 1]
Gail Hodge (1997) định nghĩa: siêu dữ liệu là "thông tin có cấu trúc mà
nó mô tả, giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử
dụng và quản lý hơn. Siêu dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin
về thông tin"
Trong thư viện truyền thống, người ta biên mục để tạo nên những biểu
ghi thư mục nhằm xây dựng hệ thống tra cứu qua mục lục phiếu. Biểu ghi thư
mục hay mục lục phiếu miêu tả lý lịch của tài liệu: nhan đề, đề mục, tác giả,
10


xuất bản,vv…Khi sử dụng máy tính, biểu ghi thư mục này được biểu thị bằng
một dạng thức máy đọc được (MARC). Cách biên mục này chỉ thể hiện được
dạng thư mục tức lý lịch chứ không có toàn văn và đa phương tiện, được gọi là
biên mục theo dạng liên tuyến (analog). Trong môi trường số, dữ liệu được
đóng gói bằng ngôn ngữ XML. Cách biên mục phải thay đổi qua môi trường
Web, nghĩa là các dữ liệu thư mục phải được đóng gói, người ta gọi là biên mục
theo dạng kỹ thuật số (digital). Các biểu ghi thư mục trở thành siêu dữ liệu thư
tịch – metadata. Vậy metadata chính là phiếu mục lục miêu tả lý lịch tài liệu

hay công bố tư liệu.
8) Loại hình (Type): hình thức vật chứa nội dung tư liệu
9) Mô tả vật lý (Format): Định dạng vật lý và kích thước của tư liệu như
kích cỡ, thời lượng,.. Định dạng cũng còn được dùng để chỉ rõ phần
mềm và phần cứng cần thiết để sử dụng tư liệu.
10) Định danh tư liệu (Identifier): Là một dãy ký tự hoặc số nhằm thể
hiện tính đơn nhất của tư liệu như: URLs và URNs, ISBN, ISSN,...
11) Nguồn gốc (Source): Nguồn gốc mà tư liệu được tạo thành, yếu tố này
có thể bao gồm siêu dữ liệu về nguồn thông tin thứ hai nhằm khai thác
tư liệu hiện hành.
12) Ngôn ngữ (Language): Ngôn ngữ của nội dung tư liệu.
13) Liên kết (Relation): Yếu tố này thể hiện những kết nối giữa những
nguồn tư liệu có liên quan.
14) Nơi chứa (Coverage): Những đặc tính về không gian và/hoặc thời gian
của tư liệu. Không gian nơi chứa chỉ ra một vùng sử dụng địa danh hoặc
toạ độ. Đặc tính thời gian trong yếu tố này chỉ ra khoảng thời gian mà tư
liệu đề cập tới.

12


15) Bản quyền (Rights): là thông tin về tình trạng bản quyền. Nếu muốn
xem phần toàn văn thì click chuột vào đường liên kết ở thành phần
Indentifier đến server – nơi cung cấp bộ sưu tập.
Dưới đây là hình minh họa các yếu tố của Dublin Core được sử dụng
trong phần Enrich của Greenstone.

Hình 1: Giao diện các yếu tố của Dublin Core được sử dụng trong phần
Enrich của Greenstone
Tiếp theo là hình mô tả siêu dữ liệu thư mục với liên kết đến phần toàn

tài liệu tương ứng như:
- TEXTPlug (*.txt, *.text): Xử lý tệp tin text thuần túy.
- HTMLPlug (*.htm, *.html; also, .shtml, .shm, .asp, .php, .cgi): Xử lý
các file HTML.
- WORDPlug (*.doc): Xử lý các tài liệu Word.
- PDFPlug (*.pdf): Xử lý tập tin pdf.

15


- PSPlug (*.ps): Xử lý tài liệu PotScript, trích thông tin metadata ngày,
tựa đề, số trang.
- EMAILPlug (*.email): Xử lý các tập tin chứa E-mail, và xử lý những
định dạng email thông thường được dùng trên Netscape, Eudora, and
Unix. Tuy nhiên, Plugin này chưa xử lý được các email mã hóa dưới
dạng MINE.
- ZIPPlug (.gz, .z, .tgz, .taz, .zip, .tar): Xử lý các file dưới dạng nén
hoặc lưu trữ như gzip (.gz, .z, tgz, .taz), bzip (.bz), zip (.zip, .jar) và tar
(.tar).
- IMAGEPlug (.gzip, .bzip, .zip, .tar,…): Xử lý các tập tin ảnh. Plugin
này chỉ dùng trên UNIX.
Các plugin xử lý tài liệu độc quyền: Đối với tài liệu độc quyền như word,
pdf, ta dùng các plugin tương ứng là WordPlug, PDFPlug, Các plugin này thực
hiện hai thao tác:
1. Chuyển tài liệu nguồn sang dạng html hay plain text
2. Xử lý plugin HTMLPlug hay TEXTPlug chuyển kết quả ở bước 1 sang
dạng XML của Greenstone. [19, tr 11]
1.1.6 Classifier ( Phân Loại)
Classifier dùng để xây dựng cấu trúc duyệt tài liệu trên web của một bộ
sưu tập. Tương tự các plugin, các classifier được đặc tả trong tập tin cấu hình

18


Hình 6. Giao diện liệt kê tài liệu theo dạng AZList
+ Classifier List: liệt kê tài liệu thành một danh sách sắp thứ tự alphabet
+ Classifier DateList: liệt kê tài liệu theo từng vùng thời gian

Hình 7: Liệt kê tài liệu theo dạng DateList
19


- Nhóm classifier liệt kê tài liệu dưới dạng phân cấp:
+ Classifier Hierarchy: liệt kê các tài liệu dưới dạng phân cấp. [19, tr
22-28]

Hình 8: Liệt kê tài liệu dưới dạng phân cấp
1.1.7 Duyệt tài liệu (Browser)
Greenstone cho phép định nghĩa trước các cấu trúc để duyệt tài liệu trong
mỗi bộ sưu tập dựa trên những metadata tìm thấy trong bộ sưu tập đó.
Ví dụ, bộ sưu tập Greenstone Demo cho phép ta duyệt các tài liệu theo
metadata “đề mục”

20


Hình 9. Minh họa duyệt tài liệu
Với những tài liệu phân cấp theo bảng mục lục, ta có thể duyệt theo chính
mục lục đó, rất tiện lợi, như hình dưới đây

Hình 10: Tài liệu phân cấp theo bảng mục lục

mẽ theo thời gian thì nhu cầu sử dụng và khai thác về thông tin của xã hội ngày
càng trở nên cao cấp hơn. Việc lưu trữ, khai thác, tổ chức, và phân phối thông
tin đòi hỏi nhiều cách thức mới. Cùng lúc đó, với cách mạng công nghệ thông
tin, đặc biệt là sự bùng nổ của công nghệ thông tin, kỹ thuật số hóa làm cho khả
năng đáp ứng nhu cầu đang tăng lên chưa từng có về lưu trữ, tổ chức và phân
phối thông tin trở thành hiện thực. Thư viện số ra đời trong bối cảnh trên, thật
sự bắt đầu cho một cuộc cách mạng trong lĩnh vực thư viện, đã và đang thay đổi
hẳn cách nhìn về nghề thư viện. Các thư viện số đã làm thay đổi nhanh chóng
cách thức thu thập và phổ biến thông tin ở nhiều quốc gia. Đứng trước yêu cầu
thực tế, năm 1995 một nhóm nhỏ các giảng viên và sinh viên Đại học Waikato,
New Zealand đã xây dựng phần mềm thư viện số Greenstone, giúp người dùng
dễ dàng xây dựng và phân phối các bộ sưu tập thư viện số. Phần mềm
Greenstone cung cấp một phương pháp mới để tổ chức và xuất bản thông tin
trên Internet và qua CD-ROM. Greenstone ban đầu là sản phẩm của dự án New
Zealand Digital Library của trường Đại học Waikato. Sau đó, thấy được ý nghĩa
và tác dụng của phần mềm, từ tháng 8/2000, UNESCO và tổ chức Human Info
NGO đã tham gia phát triển, hỗ trợ, xuất bản và phân phối cho các quốc gia
đang phát triển. Đây là phần mềm mã nguồn mở được cung cấp trên
http://www.greenstone.org theo thỏa thuận đăng kí GNU General Public
License.
Đầu năm 2004, Thư viện Đại học Khoa học Tự nhiên TP. Hồ Chí Minh
(ĐHKHTN)– đơn vị đầu tiên ở Việt Nam sử dụng Greenstone cho việc xây
dựng thư vịện số với sự hỗ trợ phát triển phiên bản tiếng Việt của Integrated e
Solution, ltd Việt Nam (IeS), giữa năm 2004 Thư viện trường Đại học Ngân
hàng Thành phố Hồ Chí Minh (ĐHNH) là đơn vị thứ hai sử dụng Greenstone
23


ây dựng thư viện số, tháng 10/2004 Trung tâm Thông tin Tư liệu Đại học Đà
Nẵng cũng đã sử dụng để tạo lập các bộ sưu tập số hóa kết hợp với phần mềm

này không phải đơn thuần như các ngôn ngữ theo hệ La tinh nên việc sưu tập và
sắp xếp tài liệu đòi hỏi kỹ thuật khác hơn là sắp xếp theo A-Z, phải dùng xắp
xếp theo trật tự riêng của từng ngôn ngữ như xếp theo Bộ của ngôn ngữ tượng
hình.
Ngoài ra các bộ sưu tập đa dạng về ngôn ngữ này còn có sưu tập của
Trường Đại học Bắc Kinh về các tài liệu cổ khắc trên tre gỗ và đá, sưu tập tiếng
Nga có Internet Mediacom của Cộng hòa Liên bang Nga.

25



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status