bµi gi¶ng th«ng tin häc
bµi gi¶ng th«ng tin häc
ch¬ng 4
ch¬ng 4
lu tr÷ vµ t×m kiÕm th«ng tin
lu tr÷ vµ t×m kiÕm th«ng tin
Khi Ta Bé
Th¸ng 4 - 2008
1. nguyên tắc lưu trữ thông tin
1. nguyên tắc lưu trữ thông tin
Giả sử D là tập hợp các tài liệu:
D={1,2,3,4,5,6,7,8}
1,2,3,... là các số hiệu của tài liệu, nó là đặc trưng hình
thức của tài liệu
T là tập hợp các chủ đề của tài liệu:
T={A,B,C,D,E,F,G,H}
Các từ khoá A=cây lúa, B=hoa màu, C=sâu bệnh, D=đất phèn
E= cây ngô, F=thuỷ lợi,G=kỹ thuật trồng trọt, H=chăn nuôi,
là đặc trưng nội dung của tài liệu
Giữa D và T xác định quan hệ hai ngôi R:
iRx nếu Tài liệu i nói về chủ đề x
Quan hệ này xác định tập con R của tích Đề
các D*T. Quan hệ này có thể biểu diễn bằng
một ma trận, gọi là ma trận tư liệu
={B,D,E,H}
....
Lưu trữ theo nội dung chủ đề của tài liệu:
Cắt ma trận theo chiều dọc: mỗi TK ứng với một
phiếu ghi số hiệu của tất cả những TL có nội dung
đề cập tới chủ đề đó
Chủ đề A ứng với d
A
={1,3,5,8}
Chủ đề B ứng với d
B
={2,4,5,7,8}
....
Đây chính là các bản chỉ mục
của TL, ghi trên phiếu hay biểu
ghi mô tả thư mục của TL, ở
mục Từ khoá
Đây chính là các bản chỉ mục
của TL, ghi trên phiếu hay biểu
ghi mô tả thư mục của TL, ở
mục Từ khoá
Đây chính là các bảng đảo của
TL. Chúng lập thành bộ phiếu
đảo (phiếu lỗ soi, phiếu uniterm,
Phương tiện lưu trữ thông tin tự động hoá:
Các biểu ghi trong các tệp dữ liệu của CSDL thư mục
Tệp chủ
Tệp đảo