Nghiên cứu phương pháp tư vấn dựa trên hành vi người dùng mạng xã hội (tt) - Pdf 42

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------

NGUYỄN THỊ YẾN

NGHIÊN CỨU PHƯƠNG PHÁP TƯ VẤN DỰA TRÊN
HÀNH VI NGƯỜI DÙNG TRONG MẠNG XÃ HỘI

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI - 2016


Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học: TS. VŨ VĂN THỎA

Phản biện 1:
……………………………………………………………………
Phản biện 2:
……………………………………………………………………

Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ
tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm 2017

Có thể tìm hiểu luận văn tại:

bao gồm: phương pháp xác định độ tương tự hành vi friend, post, like, comment.
- Nghiên cứu phương pháp xây dựng hệ tư vấn dựa vào một hành vi, hai hành vi, ba hành vi người
dùng và phương pháp kết hợp với tất cả hành vi người dùng.
- Xây dưṇ g tập dữ liệu thử nghiệm cho các điạ điể m du lich
̣ (khách sạn) do tâ ̣p người dùng trong
ma ̣ng xã hô ̣i đánh giá.

4. Bố cục của luận văn
Bố cục luận văn gồm 3 phần:
Chương 1. Độ tương đồng hành vi người dùng trong mạng xã hội.


2
Chương 2. Phương pháp tư vấn dựa trên hành vi người dùng
Chương 3. Thử nghiệm và đánh giá


3

CHƯƠNG 1: ĐỘ TƯƠNG ĐỒNG HÀNH VI NGƯỜI DÙNG TRÊN MẠNG XÃ
HỘI
1.1 Giới thiệu về mạng xã hội

1.1.1 Lịch sử hình thành
1.1.2 Cấu trúc chung của mạng xã hội
1.1.3 Một số mạng xã hội phổ biến hiện nay
1.2 Giới thiệu về hành vi trong mạng xã hội
Các hành vi trong mạng xã hội:
-



1.3 Độ tương đồng giữa các cặp người dùng dựa vào các hành vi mạng xã hội
Xét một hệ thống gồm N người dùng U  u1 , u2 ,..., u N  và M sản phẩm (hàng hóa, phim, ảnh, tạp
chí, tài liệu, sách, báo, dịch vụ hoặc bất kỳ dạng thông tin nào mà người dùng cần đến) P   p1 , p2 ,..., pM 
.
Trong mục này, luận văn sẽ đánh giá mức độ tương đồng giữa hai người dùng u i, uj, ký hiệu bởi cặp
(i, j), i, j = 1, 2, .., N (i≠ j) thông qua độ đo tương tự dựa vào các hành vi trong mạng xã hội (gọi tắt là độ
tương tự).

2.1.1 1.3.1 Độ tương tự giữa các cặp người dùng dựa vào hành vi Like
Mức độ hài lòng của tập người dùng U đối với tập sản phẩm P được biểu diễn thông qua ma trận Like
Li= {𝑙𝑖ix, 𝑖 = 1 … 𝑁, 𝑥 = 1 … 𝑀}. Mỗi giá trị 𝑙𝑖𝑖𝑥 ∈ {0,1} biểu diễn không thích/thích của người dùng

𝑖 ∈ 𝑈 đối với sản phẩm 𝑥 ∈ 𝑃 .
Không mất đi tính tổng quát của bài toán, giả sử 𝑙𝑖𝑖𝑥 = 1 nếu người dùng 𝑖 ∈ 𝑈 like sản phẩm 𝑥 ∈

𝑃, 𝑙𝑖𝑖𝑥 = 0 nếu người dùng không thích hoặc chưa từng biết đến sản phẩm 𝑥 ∈ 𝑃.
Để xác định mức độ tương tự giữa các cặp người dùng, ta dựa vào ma trận Like:


4
𝐿𝑖𝐿
={

𝐿𝑖. 𝐿𝑖 𝑇
𝐿𝑖. 𝐿𝑖 𝑇 . 𝐿𝑖𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .


𝐶. 𝐶 𝑇
𝐶. 𝐶 𝑇 . 𝐶 𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.6)

5.1.1 1.3.4 Độ tương tự giữa các cặp người dùng dựa vào hành vi Friend
Mối quan hệ giữa các người dùng i với người dùng j (i ≠ j) trong tập người dùng U được biểu diễn
thông qua ma trận Friend F = {𝑓ij, 𝑖 = 1 … 𝑁, 𝑗 = 1 … 𝑁}. Mỗi giá trị 𝑓𝑖𝑗 ∈ {0,1} biểu diễn mối quan
hệ friend của người dùng 𝑖 ∈ 𝑈 đối với người dùng j ∈ 𝑈. Giá trị 𝑓𝑖𝑗 = 1 được hiểu rằng người dùng i và
người dùng j kết bạn với nhau.
Xác định mức độ tương tự giữa các cặp người dùng dựa vào ma trận Friend.

𝐹𝐿 = {

𝐹. 𝐹𝑇
𝐹. 𝐹𝑇 . 𝐹𝐿−2

𝑛ế𝑢 𝐿 = 2
𝑛ế𝑢 𝐿 = 4, 6, 8, . .

(1.8)

1.4 Kết luận chương 1
Trong chương 1, luận văn đã giới thiệu về mạng xã hội, các hành vi người dùng trên mạng xã hội,
phương pháp tính mức độ tương đồng giữa các cặp người dùng dựa vào các hành vi người dùng trong mạng
xã hội.


vào bộ nhớ (Memory-Based [3, 4, 5]) và Lọc cộng tác dựa vào mô hình (Model-Based [6, 7, 8]).
Trong hai phương pháp này, phương pháp lọc cộng tác dựa vào bộ nhớ được sử dụng rộng dãi hơn
cho các hệ thống lọc thông tin thực tế do cài đặt đơn giản, độ chính xác cao, chi phí tính toán thấp [9]. Chính
vì vậy, hướng tiếp cận của luận văn tập trung nghiên cứu phát triển phương pháp lọc cộng tác dựa vào bộ
nhớ.
Lọc cộng tác dựa trên bộ nhớ được tiếp cận theo hai phương pháp chính: Phương pháp lọc dựa vào
người dùng (UserBased) và lọc dựa vào sản phẩm (ItemBased). Mỗi phương pháp đều có những ưu điểm
riêng khai thác những khía cạnh liên quan đến người dùng hoặc sản phẩm. Đặc điểm chung của cả hai
phương pháp này là sử dụng toàn bộ tập dữ liệu đánh giá để dự đoán quan điểm của người dùng cần được tư
vấn (AU) về các sản phẩm mà họ chưa hề biết đến. Về thực chất, đây là phương pháp học lười (LL) hay học
dựa trên ví dụ (IBL) được sử dụng trong học máy. Phương pháp được thực hiện theo hai bước: Tính toán
mức độ tương tự và tạo nên dự đoán.


7


Tính toán mức độ tương tự sim(x, y): Mô tả khoảng cách, sự liên quan, hay trọng số giữa hai
người dùng x và y( hoặc giữa hai sản phẩm x và y).



Dự đoán: Đưa ra dự đoán cho người dùng cần được tư vấn bằng cách xác định tập láng giềng của
người dùng này. Tập láng giềng của người dùng cần tư vấn được xác định dựa trên mức độ tương tự
giữa các cặp người dùng hoặc sản phẩm.
Trên cơ sở 2 bước cơ bản của hệ tư vấn cộng tác cổ điển, luận văn đề xuất các phương pháp xây dựng

hệ tư vấn cộng tác dựa vào hành vi người dùng. Các kết quả đề xuất được trình bày trong các mục tiếp theo.

2.2. Phương pháp tư vấn dựa vào một hành vi

Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

9.1.1 2.2.4 Phương pháp tư vấn dựa vào hành vi Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Friend đề xuất được thực hiện qua 5
bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Friend.
Bước 4: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 5: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

2.3 Phương pháp tư vấn kết hợp hai hành vi

10.1.1 2.3.1 Phương pháp tư vấn kết hợp hai hành vi Comment và Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend đề xuất được thực
hiện qua 6 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.


9
Bước 4: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma

10
2.4 Phương pháp tư vấn kết hợp ba hành vi
Trong phần này, luận văn sẽ trình bày phương pháp tư vấn kết hợp hành vi Comment, hành vi Like
với lần lượt các hành vi Friend và Post.

13.1.1 2.4.1 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Comment-Friend-Like đề xuất được
thực hiện qua 7 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Friend.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 4: tìm K4 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 5: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Like, ma trận Friend.
Bước 6: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 7: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

14.1.1 2.4.2 Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post
Phương pháp tư vấn cộng tác dựa vào hành vi Combinated-Like-Post-Comment đề xuất
được thực hiện qua 7 bước như sau:
Bước 1: tìm K1 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá.
Bước 2: tìm K2 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Post.
Bước 3: tìm K3 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Like.
Bước 4: tìm K4 người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận Comment.
Bước 5: tìm Ki người dùng láng giềng của người dùng hiện thời iU dựa vào ma trận đánh giá và ma
trận Comment, ma trận Like, ma trận Post.
Bước 6: dự đoán quan điểm của người dùng i đối với các sản phẩm mới xP\Pi bằng cách lấy giá trị
trung bình các đánh giá của những người dùng j trong tập láng giềng Ki.
Bước 7: chọn K sản phẩm có mức độ tương tự cao nhất tư vấn cho người dùng i.

FaceBook. Dữ liệu người dùng bao gồm:
-

5090 người dùng

-

753 khách sạn

-

2702 hành vi Rate

-

2585 hành vi Add Friend

-

961 hành vi Post

-

4629 hành vi Like

-

1995 hành vi comment

Các hành vi lấy được từ mạng xã hội FaceBook là: Friend, Post, Like, Comment, Rate.


∑𝑖∈𝑈𝑡𝑒𝑠𝑡 𝑀𝐴𝐸𝑖
|𝑈𝑡𝑒𝑠𝑡 |

3.3 Kết quả thử nghiệm
Kịch bản 1: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên hành vi đánh giá.
Số lượng người dùng trong tập láng giềng
80
R

0.4257

100

120

0.4391

0.4891

140
0.4911

Bảng 3.1: Giá trị MAE thử nghiệm dựa trên hành vi đánh giá
Kịch bản 2: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với một
trong số các hành vi Friend, Like, Post, Comment.
Việc lấy giao giữa hành vi đánh giá và các hành vi khác được thực hiện như sau:
K=KR ∩ KX
if K = ∅ then K = KR
Số lượng người dùng trong tập láng giềng


0.2373

0.2845

0.3299

RC

0.2495

0.2020

0.2061

0.2028

Bảng 3.2: Giá trị MAE thử nghiệm dựa trên việc kết hợp với một hành vi


14
Kết quả thử nghiệm cho thấy việc kết hợp với một hành vi trong mạng xã hội có độ trung bình tuyệt
đối lỗi MAE đã giảm đáng kể so với việc thử nghiệm chỉ dựa trên hành vi đánh giá ban đầu. Trong đó
phương pháp kết hợp Combinated-Comment cho kết quả tốt nhất.
Kịch bản 3: Thử nghiệm độ đo trung bình tuyệt đối lỗi MAE dựa trên việc kết hợp hành vi đánh giá với hai
hành vi người dùng trong mạng xã hội
Trong đó: Việc lấy giao giữa hành vi đanh giá và các hành vi khác được thực hiện với độ ưu tiên
theo kết quả dựa trên thí nghiệm 2, đó là RC, RL, RF, RP (độ ưu tiên giảm dần)
Số lượng người dùng trong tập láng giềng
Phương pháp

0.1986

0.2020

0.2061

0.2028

RFP

0.1995

0.2127

0.2220

0.2366

RCF

0.1984

0.1585

0.1212

0.1179

RCP



0.1371

0.1504

0.1561

0.2102

RFPC

0.1984

0.1585

0.1212

0.1179

RFLC

0.1361

0.1395

0.1016

0.1505

RPLC


0.1361

0.1395

0.1016

140
0.1505

Bảng 3.5: Giá trị MAE thử nghiệm dựa trên việc kết hợp với tất cả các hành vi
Kết quả thử nghiệm dựa trên việc kết hợp tất cả các hành vi cho kết quả MAE bằng với trường hợp
nhỏ nhất so với phương pháp kết hợp RFLC. Điều này được giải thích bằng việc không tồn tại người dùng
nào trong tập láng giềng qua việc lấy giao của hành vi đánh giá với cả 4 hành vi, thay vào đó việc lấy giao
này dựa trên kết quả của RFLC.

3.4. Kết luận chương 3
Kết quả thử nghiệm các phương pháp tư vấn kết hợp đề xuất cho thấy chất lượng tư vấn được cải
thiện đáng kể so với các phương pháp tư vấn cơ bản. Điều đó chỉ có thể lý giải phương pháp tiếp cận của
luận văn đã xác định được tốt hơn mức độ tương tự giữa các cặp người dùng, cũng như phương pháp dự
đoán thích hợp nhất.


16

KẾT LUẬN
1. Kết quả đạt được
Đề tài hướng tới một chủ đề có ý nghĩa về lý thuyết và thực tiễn của khoa học máy tính được cộng
đồng nghiên cứu quan tâm. Luận văn đã trình bày về các vấn đề liên quan đến mạng xã hội và một số
phương pháp tư vấn dựa vào hành vi người dùng trong mạng xã hội. Cụ thể là:

-

Phương pháp tư vấn kết hợp hai hành vi Comment và Post

Phương pháp tư vấn kết hợp ba hành vi:
-

Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Friend

-

Phương pháp tư vấn kết hợp ba hành vi Comment, Like, Post

Phương pháp tư vấn kết hợp bốn hành vi Comment, Like, Friend, Post
Đề tài giới thiệu bộ dữ liệu thử nghiệm cho các thuật toán đã trình bày trong từng phương pháp tư vấn.
Thử nghiệm cài đặt trên Matlab cho từng thuật toán ứng với bộ dữ liệu đã thu thập được. Kết quả thử nghiệm
được đánh giá theo các tiêu chí về độ chính xác, sai số trung bình và thời gian thực hiện tư vấn.
Tuy nhiên trong quá trình thực hiện và cài đặt mô hình thuật toán vẫn còn một số hạn chế sau:
-

Thưa thớt dữ liệu người dùng: bộ dữ liệu sưu tập bằng tay lên còn hạn chế, trong quá trình thu thập dữ
liệu, người dùng trong mạng xã hội không công khai danh sách bạn bè, không thể hiện hết được hành
vi, mối quan hệ giữa các người dùng với nhau.
Đề tài sử dụng nhãn tích cực với các văn bản comment và post, chưa tính chưa xử lý khía cạnh nhãn là

tiêu cực.


17
2. Hướng phát triển

[10]X. Su, T. M. Khoshgoftaar (2009), “A Survey of Collaborative Filtering Techniques”. Advances in
Artificial Intelligence, vol 2009, pp.1-20.
[11] Zan Huang, “Graph-Based analysis for e-commerce recommendation”, 2005.
[12]R. Jin, L. Si, and C. Zhai, “Preference-Based Graphic Models for Collaborative Filtering”, Proc. 19th
Conf. Uncertainty in Artificial Intelligence (UAI 2003)
[13]https://vi.wikipedia.org/wiki/D%E1%BB%8Bch_v%E1%BB%A5_m%E1%BA%A1ng_x%C3%A3_h%
E1%BB%99i




Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status