NGHIÊN CỨU CẢI TIẾN GIẢI PHÁP THIẾT KẾ HỆ HỖ TRỢ TÌM KIẾM THEO NGỮ NGHĨA TRÊN KHO TÀI LIỆU KHMT - Pdf 27

BÁO CÁO LUẬN VĂN THẠC SĨ
NGHIÊN CỨU CẢI TIẾN GIẢI PHÁP THIẾT KẾ
HỆ HỖ TRỢ TÌM KIẾM THEO NGỮ NGHĨA
TRÊN KHO TÀI LIỆU KHMT
HỌC VIÊN: CHÂU KIM HÙNG
HƯỚNG DẪN KHOA HỌC: PGS. TS. ĐỖ VĂN NHƠN
Nội dung
1.
2.
3.
4.
5.
Giới thiệu đề tài
Cải tiến mô hình CK-ONTO
Các vấn đề và thuật giải cải tiến
Ứng dụng và thử nghiệm
Kết luận và hướng pháp triển
1.1.
Đặt vấn đề
Tầm quan trọng của các hệ thống thư viện điện tử, các hệ quản lý
tài nguyên học tập.
Một số công cụ tìm kiếm và hệ thống quản lý tài nguyên thông dụng
hiện nay
1.1.
Giải pháp “Thiết kế hệ thống truy vấn tài liệu” đã đưa ra một giải pháp tổng thể,
mang tính hệ thống cho việc quản lý thông tin ngữ nghĩa liên quan đến nội dung
tài liệu và hỗ trợ biểu diễn ngữ nghĩa và xử lý trong truy vấn tài liệu.
Đặt vấn đề (tt)
Kết quả:
Hệ thống tổng
hợp tin tức trực


Nghiên cứu đề xuất một mô hình
ontology cải tiến dựa trên việc định
nghĩa thành phần lớp có mô tả cấu
trúc thông tin và xây dựng tập các
luật phổ biến trên miền tri thức của
lĩnh vực:

- Mở rộng việc xử lý câu truy vấn
- Cải tiến kỹ thuật tính toán và so
khớp các đồ thị keyphrase

2.
Cải tiến mô hình CK-ONTO
1
Vai trò của ontology trong giải pháp
2
Mô hình CK-ONTO
3
Mô hình CK-ONTO cải tiến
2.1.
Vai trò của ontology trong giải pháp
Mô hình cơ sở tài liệu có ngữ nghĩa
(Semantic Document Base - SDB)
FS
CK-ONTO
DB
SDB_R
Tập hợp các tài
liệu, mỗi tài liệu

Mô hình CK-ONTO
Mô hình “Ontology cho các keyphrase được phân lớp” (CK-ONTO)
(K, C, R
KC
, R
CC
, R
KK
, label)
trong đó, các thành phần được mô tả như sau:

 K : tập hợp các keyphrase

 C : tập hợp các lớp keyphrase

 R
KC
: tập hợp các quan hệ giữa keyphrase và lớp

 R
CC
: tập hợp các quan hệ giữa các lớp

 R
KK
: tập hợp các quan hệ giữa các keyphrase

 label : hàm gán nhãn phân loại keyphrase
2.2.
Mô hình CK-ONTO (tt)

2.3.
Mô hình CK-ONTO cải tiến (tt)
Ứng dụng ontology trong các hệ thống tìm kiếm
Chức
năng
Tập
trung vào
Đặc
điểm kỹ thuật ontology

Truy
vấn tài liệu
Khái
niệm
Khái
niệm, tính phân cấp
Duyệt
tri thức
Cấu trúc của ontology

Thuộc
tính và quan hệ
Đưa
ra sự phản hồi
Suy luận

Lôgíc
và ràng buộc
Trong các hệ thống hỗ trợ giáo dục, ontology được sử
dụng chủ yếu cho 3 mục đích: (1) biểu diễn và lưu trữ

K
1
: tập keyphrasr đơn, K
2
: tập keyphrase tổ hợp
KEYPHRASE
Thành phần chính để hình thành các
khái niệm của ontology.
Một đơn vị ngôn ngữ học cấu trúc
như một từ, một từ kép,
một ngữ.

Sử dụng các keyphrase làm yếu tố
đơn vị để mô tả tri thức trong lĩnh
vực hay nội dung tài liệu.
CẤU TRÚC
Keyphrase đơn: cấu tạo bằng một
đơn vị từ vựng đơn.
Ví dụ : “computer”, “network”,
“database”
Keyphrase tổ hợp: nhiều đơn vị từ
vựng đơn kết hợp thành (đẳng lập,
chính phụ)
Ví dụ: “image processing”, “database
programming”
2.3.
(K, C, R, Rules, label)
Mỗi lớp trong tập C là một hệ thống gồm ba thành phần
(K
b

p các keyphrase c

a lĩnh v

c đang xét
Định nghĩa: keyphrase nền là keyphrase thể hiện ngữ nghĩa quan trọng hình
thành nên định nghĩa của một khái niệm ở dạng ngôn ngữ tự nhiên; trong đó,
tên khái niệm cũng chính là tên của lớp.
Ví dụ: Xét định nghĩa của khái niệm “a programming language”:
“A
programming language
is an
artificial language
designed to communicate
instructions to a machine, particularly a computer. Programming languages can
be used to create
programs
that control the behavior of a machine and/or to
express
algorithms

Mô hình CK-ONTO cải tiến (tt)
2.3.
(K, C, R, Rules, label)
Tập hợp Attr các thuộc tính
Thuộc tính là thành phần thể hiện tính đặc trưng cho lớp, mô tả cấu trúc bên
trong của khái niệm. Trong đó, tên thuộc tính là tên của keyphrase hoặc là tên
của lớp.

Một số kiểu giá trị của thuộc tính như: String, Number, Boolean, Instance.

Một thực thể là một đối tượng cụ thể của lớp. Tên của thực thể là tên của một
keyphrase k  K và thực thể có cấu trúc là cấu trúc của lớp mà nó thể hiện.

Giả sử, ta có lớp B là lớp dẫn xuất của lớp A, khi đó:
Inst
B
 Inst
A
Trong đó:
- Inst
A
là tập thực thể của lớp A
- Inst
B
là tập thực thể của lớp B

Ví dụ: BINARY SEARCH ALGORITHM là một thể hiện của lớp ALGORITHM
INSTANCE NAME PROPERTY VALUE
Binary Search
Algorithm
complexity
logarit

complexity
data structure array
heuristic false
recursive true
Mô hình CK-ONTO cải tiến (tt)
2.3.
(K, C, R, Rules, label)

,r
RE
, r
PART_OF
}
 Quan hệ phân cấp trên lớp r
HYP

SuperClass

SubClass

ALGORITHM

SEARCHING
ALGORITHM
ALGORITHM

SORTING
ALGORITHM
SEARCHING

ALGORITHM

SHORTEST
PATH SEARCH ALGORITHM
SEARCHING

ALGORITHM



“is
a part of”
DATA
TYPE
PROGRAMMING
LANGUAGE

“is
a part of”
OPERATING
SYSTEM
SMART
PHONE
“is
a part of”
 Quan hệ “có liên quan” giữa các lớp Rre

Related
Class
Intermediary
Class
Class
DATA
TYPE
DATA
STRUCTURE

,r
RE
, r
PART_OF
}
 Quan hệ A-Part-of giữa keyphrase và lớp r
PART-OF

Property
Keyphrase
Class
heuristic

ALGORITHM

“is
a part of”
type
checking
PROGRAMMING
LANGUAGE
“is
a part of”
operator

DATA
TYPE

PART-OF

Related
Keyphrase

Intermediary
Class
Class
operator

DATA
TYPE
ALGORITHM

“related”

function

LIBRARY

PROGRAMMING
LANGUAGE
“related”

Mô hình CK-ONTO cải tiến (tt)
2.3.
(K, C, R, Rules, label)

1

Synonym

syn

A
đồng nghĩa với B
(
Twittworking,
Twitter
networking)

r
2

Acronym

acr

A
là dạng viết tắt của B
(KR,
knowledge representation)
r
3

Near
synonym
nsyn

 Nhóm quan không phân cấp
r
6

Extension

ex

A
là mở rộng của B
r
7

Same
class
Sacl

A
cùng lớp với B
r
8

Relation

re

A
có liên quan với B
r
9

make

A
tạo ra B
r
13

Possession

poss

A
sở hữu B
r
14

Source

source

A
có xuất xứ từ B
r
15

Aim

aim

Th


Support

support

A
xây dựng trên nền tảng B
r
20

Beneficiary

benef

A
hưởng lợi ích từ B
r
21

Property

pro

A
là một thuộc tính của B
r
22

Agent


được ứng dụng trong B
Mô hình CK-ONTO cải tiến (tt)
2.3.
(K, C, R, Rules, label)
Tập hợp Rules các luật suy diễn
Rules là tập hợp các luật suy diễn trên các sự kiện liên quan đến tính chất của quan hệ
hoặc sự kiện liên quan đến các keyphrase và các lớp.

Có 2 loại sự kiện chính: sự kiện về tính chất của quan hệ và sự kiện về quan hệ giữa 2
đối tượng (giữa k và k’, giữa c và c’, hoặc giữa k và c).

Định nghĩa: (các loại sự kiện)
(1) Sự kiện thông tin về tính chất của quan hệ: [<relation>, <property_of_relation>].
Ví dụ: [R
sym
, “Đối xứng”]

(2) Sự kiện về quan hệ giữa 2 đối tượng: [<obj
1
>, <relation>, <obj
2
>] Lo
ại sự kiện

dụ
a
. Sự kiện về quan hệ giữa keyphrase và keyphrase


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status