HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN THANH HẢI
ĐỀ TÀI
NGHIÊN CỨU PHƯƠNG PHÁP HỌC CHUYỂN GIAO CHO
LỌC CỘNG TÁC
8 LUẬN VĂN THẠC SĨ KỸ THUẬT
LỜI CẢM ƠN
Trong thi gian hc tp ti Hc vi
c s y bng dn tin gi li
cc bit xin gi li cng nht
ti thy n Duy ng dn em trong sut
c hit nghi
12CQCT01
.
-
k thut
.
!
Học viên
Nguyễn Thanh Hải ii
LỜI CAM ĐOAN
u c liu, kt
qu trong bt
k
1.6. Chuyn giao tri thc t 10
1.7. ng dng ca hc chuyn giao 10
1.8.Kết luận chương 1 10
CHƯƠNG 2: LỌC CỘNG TÁC BẰNG PHƯƠNG PHÁP HỌC CHUYỂN GIAO 12
2.1. c c 12
2.2. Mt s 13
iv
2.3. Lc c nh 14
2.3.1. 15
2.3.2. Hn ch c--Based 16
2.3.3. i tin 17
2.4. c chuyn giao cho lc c 18
2.4.1. Hc chuyn giao t n sn phm 18
2.4.2. Hc chuyn giao t sn ph 20
2.4.3. Kt hp gia hai ki 22
2.4.3.1. - UserBased 23
2.4.3.2. -ItemBased 27
2.5. minh ha 30
2.6. Kết luận chương 2 37
CHƯƠNG 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ 38
3.1. D liu th nghim 38
3.2. nghim 39
3.3. Kt qu th nghim 40
3.4. t qu 43
3.5. Kết luận chương 3 45
KẾT LUẬN 47
TÀI LIỆU THAM KHẢO 48
UTL
Unsupervised Transfer Learning
Hc chuy vi
DANH MỤC CÁC BẢNG
Bảng 1.1 Phân loại các phương pháp học chuyển giao 6
Bảng 1.2 Phân loại theo tình trạng dữ liệu 7
Bảng 2.1 Ma trận đánh giá người dùng - sản phẩm 13
Bảng 2.2 Ma trận đánh giá theo quan sát từ người dùng 20
Bảng 2.3 Ma trận đánh giá theo quan sát từ sản phẩm 22
Bảng 2.4 Ma trận đánh giá ban đầu 31
Bảng 2.5 Ma trận đánh giá quan sát theo người dùng 33
Bảng 2.6 Ma trận đánh giá quan sát theo sản phẩm 34
Bảng 2.7 Bảng mức độ tương tự giữa các sản phẩm 35
Bảng 2.8 Ma trận kết quả Transfer – UserBased sau vòng lặp t=1 36
Bảng 2.9 Bảng mức độ tương quan giữa các người dùng 36
Bảng 2.10 Ma trận kết quả của phương pháp Transfer-UserBased 37
Bảng 3.1 Bảng ví dụ đánh giá độ đo trung bình tuyệt đối 40
Bảng 3.2 Kết quả thực nghiệm phương pháp học chuyển giao dựa vào người dùng 41
Bảng 3.3: Kết quả thực nghiệm phương pháp học chuyển giao dựa vào sản phẩm 42
Bảng 3.4 Giá trị MAE trên tập ml -100K 44 vii
DANH MỤC CÁC HÌNH
c chuyn giao tri th
li th n ch ca mc chuy u
c chuyn giao, la ch th gii quy
lc c
2
Chương 2: Lọc cộng tác bằng phương pháp học chuyển giao
c cmt s truyn
thng thc hic c
n ch c xui
ti i cho lc c thut hc
chuyp Transfer--ItemBased.
Chương 3: Thử nghiệm và đánh giá
c hin th nghi xut
Tranfer- - d liu MovieLens c
u GroupLens thui ht qu v
n th u qu c
i.
3
CHƯƠNG 1: TỔNG QUAN VỀ HỌC CHUYỂN GIAO
1.1. Giới thiệu chung
th liu truyn th
dt gi thuyng d liu hun luyng
d liu thc t
b c t
ra gi s i trong mt min m
d liu hun luyn trong mit nhiu d liu s
f(x) ca mt ca mt mu x mi.
4
m d liu min ngun D
S
= {(x
S1
,y
S1
Sn
,y
Sn
)}
Si
X
S
u d liu, y
Si
Y
S
m d
liu mi
T
={(x
T1
,y
T1
c t D
S
, T
S
ci thi i f
T
(.) ca T
T
trong min D
T
u kin D
S
D
T
hoc T
S
T
T
.
1.3. Phân loại các phương pháp học chuyển giao
T hc chuyn giao, d ng ca d liu
min ngu liu mi c chuyn
giao sau:
1.3.1. Học chuyển giao quy nạp (Inductive transfer learning)
Định nghĩa học chuyển giao quy nạp: Cho mt min ngun D
S
v T
S
T
T
!=T
S
i ph
d lii trong mi vic h
f
T
(.) ca T
T
thc hi c, vic hc chuyn giao ch nhm ci thi
ng h t nhiu d li c g i min
ngu tic T
S
,T
T
ng thc
m,
5
n vic ci thin chng ca vic hc T
T
dng tri thc thc t
T
S
.
ng h li i min
ngun, hc chuyn giao s hc.
1.3.2. Học chuyển giao tăng cường (Transductive transfer learning)
ng d lii trong mi
c chuyn giao ng li
i ti mit nhiu d lii
min ngun tu kin thun li cho vic h
T
n
luyn do T
T
= T
S
t D
S
!= D
T
ng tri thc hc
min ngun s phu chm th
ng hp D
S
!= D
T
do P
S
(X) != P
T
(X), hai mic
nhau ch m u kin
t ging vu kin c n mn
lc.
ng hp D
S
S
u kin T
S
!= T
T
Y
S
,
Y
T
c.
6
T
S
!= T
T
ging c chuyn giao
quy nc chuy
h mim, gim chi. Vi
h li trong
min ngun ln mi
1.3.4. Tổng kết phân loại các phương pháp học chuyển giao:
T gia min ngun
vi mi ngun v
p hc truyn giao theo bng sau:
Bảng 1.1 Phân loại các phương pháp học chuyển giao
c
T
S
7
Bảng 1.2 Phân loại theo tình trạng dữ liệu
c
D
T
D
S
Hc quy np
i/
Hi quy
Hm
T hc
Hc ng
i/
Hi quy
n,
ly mn
lc
H
ng hp D
S
T
t s mu d liu min ngu c,
trong khi mt s mu l c mi
s dng hiu qu hun luyn min ngu
dc cu d liu hun luy
ta cn phi li trng s c hun luyp vi min
1.4.2. Chuyển giao tri thức thông qua ví dụ huấn luyện trong học tăng
cường
c chuyn giao ng liu
min ngung
nhau. Vng hp chuyn giao tri th hun luy
li min nguy vic h
h thc hin ngun.
c m
c tng vi mt tham s c ti d kin. Trong
thc t t d li bit
b liu hun luy liu hun luy
c ng vi tham s c ti thc nghim.
Do P(D
S
T
liu min ngu
c ti trng s c
s pht P
T
(x
Ti
,y
Ti
)/P
S
(x
Si
,y
Si
) = P(x
Ti
)/P(x
Si
) ch thuc
Ti
Si
t nhi
liu min ngu
9
1.5. Chuyển giao tri thức từ biểu diễn đặc trưng
Trong chuyn giao tri thc t biu di g
mt biu dit nhm s t gia hai mim t l
li quy. Chin thu t biu dit theo mc
rng d liu ca hai min.
gim chi ng gi lp mt
b dng gii thut gim chin
ngu chy lp l t nht cho mi
1.6. Chuyển giao tri thức từ các quan hệ
n giao tri thn giao tri thc t
ch ng trong hc chuyng hp hai mi
mi quan h v liu gia hai mic lng
gng chuyi quan h t gia d liu
min ngun d liu mi thut hc th c s dng
gii quyt v
1.7. Ứng dụng của học chuyển giao
Trong nhc chuyc ng d
trong rt nhiu ng dng thc t. Hc chuyn giao ci thi chng ca
i d liu. Hc chuy
dng r n t nhiu ngu
ng ca lc c thng lc email spam,
chuyn giao tri thnh v thi gian.
1.8.Kết luận chương 1
i thiu chung v hc chuyn giao, nh nh
i thiu ba hc chuym:
Hc chuyn giao quy np
11
Hc chuyn giao ng
Chuy
3 p cn gm:
Hc chuyn giao tri th hun luyn
Hc chuyn giao tri thc t biu di
Hc chuyn giao tri thc t quan h
T nhng ph d n thy vic s dng hc
N P = {p
1
,
p
2
, , p
M
M p
x
P
p
x
P xP
u
i
U iU.
U P
R={ r
ix
}, i = 1 N, x = 1 Mr
ix
i
U x
Pr
ix
4
p
5
p
6
p
7
u
1
4
2
5
3
3
u
2
5
5
5
4
4
2.1 R = (r
ij
U = {u
1
, u
2
, u
3
, u
4
, u
5
P = {p
1
, p
2
, p
3
, p
4
, p
5
, p
6
, p
7
Pearson [8]. Sarwar
4
18].
2.3. Lọc cộng tác dựa vào bộ nhớ
8
(ItemBased [4
15
2.3.1. Phương pháp UserBased và ItemBased
quan
quan
Bước 1. Tính toán mức độ tương tự giữa các cặp người dùng hoặc sản phẩm.
4, 8, 15, 19].
u
ij
PPx
iix
PPx
jjxiix
ij
rrrr
rrrr
u
(2.1)
22
yxyx
yx
UUi
yiy
UUi
xix
UUi
yiyxix
xy
r
PP
r
1
(2.4)
yx
UUi
ix
yx
x
r
UU
r
1
(2.5)
16
yx
UUx
jx
i
i
Kj
ij
ij
Kj
jjx
iix
u
urr
rr
(2.7)
x
x
Ky
xy
Ky
iyxy
ix
u
5
u
2
2.1). Khi hai