ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN DUY PHƢƠNG Phát triển một số phƣơng pháp lọc thông tin
cho hệ tƣ vấn LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Tôi xin L
, n
luôn
3
MỤC LỤC
11
12
13
15
. 16
CHUNG 16
17
18
19
21
1.2. 24
25
25
25
28
29
30
30
69
72
.
73
75
75
- 76
3.2.2.1.
- 78
3.2.2.2.
G
+
80
3.2.2.3.
105
ecall và F-measure 105
107
110
111
113
116
117
117
127
6
DANH MỤC CÁC CHỮ VIẾT TẮT
KÝ HIỆU
DIỄN GIẢI
AM
AU
CBF
Content-
CF
DAC
DBC
Data-
LSE
LSM
MAE
MBF
Memory-
MC
MDBF
Model-
ML
MM
7
MMM
Multinomial Mixtu
MTL
PCA
RS
SD
SDP
8
DANH MỤC CÁC HÌNH
Hình 1.1. 17
Hình 1.2 31
Hình 2.1 52
Hình 2.2. 58
Hình 2.3. 58
Hình 2.4-
toán. 62
Hình 2.5. 64
Hình 3.1. - 76
Hình 3.2.
+
79
Hình 3.3.
-
80
Hình 3.4.
+
81
Hình 3.5.
-
84
Hình 3.6. 86
Hình 3.7. 90
74
X - 76
X
+
79
X
-
80
89
- 89
10
- 90
, Recall, F-
MovieLens1 106
-
MovieLens2 107
-
108
-test v
109
-
109
-
109
-
nghi
12
Recommender System
Netflix.com, Procter & Gamble.
Content-Based FilteringCollaborative Filtering).
Trong quá trì,
Phát triển một số phương pháp lọc thông tin cho hệ tư vấn
2. Mục tiêu của luận án
và
trong
14
Đóng góp thứ hai của luận án là đề xuất một phương pháp lọc kết hợp dựa
trên mô hình đồ thị [2, 80
-
-
-
-
-
-
trong [3,
81].
Chƣơng 3.
trong [2, 80].
Phần phụ lục.
16
CHƢƠNG 1
TỔNG QUAN VỀ LỌC THÔNG TIN CHO HỆ TƢ VẤN
trong các
1.1. GIỚI THIỆU CHUNG
Customer- Business to Business) [75].
1.1.1. Kiến trúc tổng quát của hệ thống lọc thông tin
[99]: ThData Analyser Component
hình User Model Component), h Learning
ComponentlFiltering Component).
Hình 1.1. Kiến trúc tổng quát của hệ thống lọc thông tin.
Thành phần phân tích dữ liệu (DAC)
Hình 1.1.
Thông tin các
dùng
heo.
1.1.2. Lọc thông tin và truy vấn thông tin
Belkin và Croft [75] hai
IR). Tuy nhiên,
Kiểu người dùng
là ai. Trái
19
dùng
Biểu diễn nhu cầu thông tin.
dùng. cá nhân,
mà còn
Mục tiêu hệ thống.
Cơ sở dữ liệu.
trên trên
Lọc dựa trên dữ liệu (DBC)
và .
21
Chính vì vậy, luận
án sẽ tập trung nghiên cứu kỹ thuật lọc thông tin cho hệ tư vấn dựa trên cách
tiếp cận này.
1.1.4. Lọc thông tin và các hệ tƣ vấn
Hệ tƣ vấn (RS)
có 5, 26,
40, 51, 53, 54, 67, 70, 83].
Amazon.com, Netflix.com, CDNOW, J.C. Penney,
Procter & Gamble
7].
23
thông tin cho [36].
Bảng 1.1.
PHƢƠNG PHÁP TƢ VẤN DỰA VÀO LỌC NỘI DUNG
Lọc nội dung dựa vào bộ nhớ
Lọc nội dung dựa vào mô hình
Các kỹ thuật thông dụng:
Những nghiên cứu điển hình:
Balabanovic và Shoham [69]
Pazzani và Billsus [73]
Các kỹ thuật thông dụng:
Những nghiên cứu điển hình:
Pazzani [74]
Mooney và Roy [92]
Những nghiên cứu điển hình:
Nakamura và Abe [11]
Umyarov và Alexander
Tuzhilin [15, 16, 17]
Ungar và Foster [68]
Chien và George [114]
Condliff 71]
Kumar 9]
Shani 41]
Hofmann [95, 96]
Marlin [18]
24
Goldberg và cá
Si và Jin [66]
Getoor và Sahami [65]
Huang và các 9]
DeCoste [31]
Nikovski và Kulev [33]
5, 106,
107]
PHƢƠNG PHÁP TƢ VẤN DỰA VÀO LỌC KẾT HỢP
Lọc kết hợp dựa vào bộ nhớ
Những nghiên cứu điển hình:
Gunawardana và Meek [8]
Billsus và Pazzani [29]
Lazanas và Karacapilidis [10]
12]
Hofmann [96]
Huang 20,
121, 122]
4]
Balisico và Hofmann [47]
Good
1.2. PHƢƠNG PHÁP LỌC THEO NỘI DUNG
4, 6, 19, 69, 73, 84, 92
Formatted: Indent: Left: 0.25"