B GIÁO DO
I HC LC HNG
NH NGHIÊN CU VÀ PHÁT TRIN THUT TOÁN
TÌM PHN T CHÍNH YU
TRONG MNG XÃ HI VÀ NG DNG LU THÔNG TIN
L ng, ngoi tr các kt qu tham kho t các
công trình khác và mt s lý thuyt trên internet ngun
tham kho trong luc trình bày trong lu
này là do chính tôi thc hin ni dung nào ca lun
c n ly bng cp ng này hong khác.
Ngày tháng
nh
LI C
Tôi xin gi ln Thy Cô, bng
n tr tôi rt nhiu v kin th
tinh thn trong quá trình tôi thc hin lu
tp d liu thc t.
DANH MC NHNG T VIT TT TRONG LU
BFS : Breadth First Search
CNTT : Công Ngh Thông Tin
JUNG : Java Universal Network / Graph Framework
MXH : Mng Xã Hi
SNA : Social Network Analysis
DANH MC HÌNH
Hình 1.1: Mô t mng xã hi. 1
Hình 2. 1: Mô hình mng Xã hi (Social Network) 6
Hình 2.2: Mô hình mng xã hi Facebook. 7
Hình 2.3: Mô hình các thành viên ca mng Twitter. 8
Hình 2.4: Mô hình phân bit Follower và Friend trong mng Twitter 10
Hình 2. 5: Giao din chính ca mng Facebook 11
i truy cp Facebook trong 1 tun t n
04/08/2012 (ngun socialbakers.com) 11
Hình 2.7: Biu din tnh trong mô hình mng. 13
Hình 2.8: Din t th th ng 14
Hình 2.9: Ví d ng 15
Hình 2.10: Mô t các thành viên trong mng xã hi 18
Hình 2.11: Ví d m th gnh 19
Hình 2.12: M th g tìm Degree Centrality 20
Hình 4.16: Tính Degree Centrality 64
Hình 4.17: Tính Betweenness Centrlity 65
Hình 4.18 Tính Closeness Centrality 65
Hình 4.19: Hin th kt qu c 65
Hình 4.20: Mô t tp d liu thc nghim 69
Hình 4.21: Giao din kt qu cui cùng c 67
DANH MC BNG
B nh sau khi tính toán 20
B th gnh 21
Bng 2.3: th 25
Bn nht ca tt c th 26
B Closeness Centrality c th 29
Bng 2.6: M Closeness Centrality ca mng 36
Bng 3.1: Cách thc duy th bng Thut toán BFS 51
Bng 4.1: Cách th d li th bng Danh sách liên thuc. 61
Bng 4.2: Cách th d li th bng Danh sách liên k 62
MC LC
*
NG QUAN 1
1.1. Gii thi tài 2
1.2. Lý do ch tài 3
d. Thut gin nht t mn tt c nh còn
l th. 48
T K XÂY DC
NGHIM 53
4.1. Gii thiu. 53
4.1.1. n 1: Thu thp và rút trích d liu 53
4.1.2. n 2: X lý d liu 54
4.1.3. n 3: 58
4.2. T ch d liu. 58
4.2.1. Gii thiu 58
4.2.2. d liu. 59
a. Cu trúc ma trn k 59
b. Danh sách liên kt 60
4.3. Xây dng h thng gii quyt bài toán tìm phn t chính yu. 63
4.4. Kt qu thc nghim. 66
T LUNG PHÁT TRIN 69
5.1. Nh tài 69
5.2. Hn ch c tài, cách khc phc 70
5.3. ng phát trin 70
TÀI LIU THAM KHO -1-
NG QUAN
các nhóm xã h
ng xã hi" (Social Network Analysis -
c nghiên cu và ng dng ngày càng nhi
cu xã hi hc nói riêng và khoa hc xã hi nói chung. Ti Vi
pháp phân tích mng xã hi còn khá mi mc ng d
pháp phân tích này còn khá hn ch.
nh phn t chính yu
(Key player) hay còn gi là nhng tác nhân quan trng trong mng xã hi.
Phn t chính yu là các phn t trong mc xem là quan trng xét
theo mu ki nói rng, key player là nhng node có kh
u khin lung thông tin, là nhng node ni bt nht và có tm nh
n các node khác trong mng xã hi.
nh các mi liên kt ca mt
th. Thông qua Centrality, ta có th phát hic thc th nào
trong mng là quan trng và có tm n nhng thc th khác.
Dn nhnh ca m th có
ng. Có th xem mng xã h th ng, các thc th trong
mnh (node) c th, mi quan h gia các thc th trong mng
là các cnh (link) c th.
t ra là xây dng thun nh
nh c th, t nh thc th nào là quan trng nht, có tm nh
ng ln nht ti các thc th khác trong mng xã hi.
Các v t ra n
-3-
Các khái nim v mng xã h
Link, Edge, Clique,
Cu trúc d lia mng xã hc t ch
này là:
- Nghiên cu v mng xã hi (Social Network).
- Tìm hiu v Key player trong mng xã hi.
- Tìm hiu v các lo ng xã hi.
- Tìm hiu v k thut phân tích mng xã hi.
- Nghiên cu và phát trin thunh tp các phn t chính
yu trong mng xã hi d
- c nghim da trên:
o Mng tham kho các bài báo trên Internet.
o Mng liên kt các trang web (web link)
- Hin thc thut toán tìm Key players ba.
1.4. Phm vi nghiên cu c tài
tài tp trung vào tìm hiu và nghiên cu các v sau:
Tìm hiu v mng xã hi và các v liên quan.
Trin khai xây dng c nghim, xây dng ng dng
và tt gii thut cho bài toán n nht
trong mng liên kt các websites.
Th nghii thut trên b d liu thc t
C th tài thc hin các ni dung sau:
Nghiên cu các mô hình mng xã hi truyn thông.
Tìm hihân tích mng xã hi.
Tìm hiu mt s phn mm phân tích mng xã hi.
Tìm hiu thun nh th ng
và vng) và các lo . T xây d
trình mô phng thut toán áp dnh phn t
chính yu trong mng xã hi.
-7-
S i c
Youtube, Google+n cho mng xã hi ngày càng tr
ng, ph bi
- Nói mt cách khác, MXH là mng tp hp các công c, dch v trc
tuyn t - email, dio lun , blogs, chat, các
trang mng xã hi, các trang chia s hình n tr s
i gia nhi s dng. [8]
Hình 2.2: Mô hình mng xã hi Facebook.
Ngun: http://julianhopkins.net
2.2. Các Mng Xã hi thông dng hin nay.
2.2.1. Mng xã hi Twitter
a. Gii thiu tng quan
Twitter là mt mng xã hi vc chia s theo thi gian
thc, cho phép m i giao tip b i nhng mu tin
ngn (ch 140 ký t).
-8-
T nhng li ích thc t rt ln nên vic s dng Twitter cho Internet
u mà bt c mt marketer n phi thc hin, nó
giúp cho vic kt ni và chia s n các khách hàng cùng s
dng Twitter (ngun http://forum.digitalmarketing.vn).
c thành lp c s dng bi
nhi trong hu hc trên th gii. Dch v có sn trong
p tc cp nht thêm.
Hình 2.3: Mô hình các thành viên ca mng Twitter.
digitalmarketing.
Listi dùng trong mi nhóm, nhóm có
th do bn t to.
Search i dùng tìm kim các Tweet có liên quan
hoc cha cm t mà h m.
Timeline: Gia Facebook, Timeline hin th các
tweet ca bn và ca nhi b.
Trending Topic: Twitter s hin th c cho là 'hot' trong
th m hin ti, bn s th c hin th
theo khu v ca bn.
-10-
Unfollow c v ng cách
click vào nút Unfollow), bn s không th nhn các update t i
.
Hình 2.4: Mô hình phân bit Follower và Friend trong mng Twitter
Ngun: Twitter.com
2.2.2. Mng xã hi Facebook
a. Gii thiu tng quan
Facebook là mt website mng xã hi truy cp min phí do công ty
u hành. i dùng có th tham gia các mc
t chc theo thành phng hc và khu v liên kt và
giao tip vi khác. M kt bn và gi tin nhn
cho h, và cp nht trang h thông báo cho bn bè
bit v chúng. Tên ca website nhc ti nhng cun s
ghi tên nhng thành viên ca cng campus mà mt s ng i
hc và cao ng ti M n mng, phòng ban,
link, note
Like: Nó là mi, khi
bn click vào tc là b mình Like mt status, bình lun
hoc m các website khác (nu nút Facebook Like
c add vào website này).
Friends: Bn bè ca bn trong Facebook, bn có th yêu cu
kt bn vi mc li, mi có th yêu cu kt
bn vi b giúp bn suggest bn bè cho
i khác, hoc t tìm bn bè cho bn (nu bn mi bu s
dng).
New Feeds i nht (thông tin, status,
bn bè và các nhóm xã hi ca bn, nó s c cp
nht theo thi gian.
Tagn din mu
trong mt hình nh, video hoc bài vi
(ngun http://digitalmarketing.vn/)
2.3. Các khái nin trong vic t chc mng xã hi
Trong phân tích mng xã hi, ta xem xét mng xã h th mng
bao gnh (nodes), các cnh (links). Node biu din tp các tác nhân,
-13-
thc th, còn link biu din mi quan h (relation) gia các tác nhân, thc
th
2.3.1. Tnh
Trong lý thuy th, tp nh còn c gi là tp nút (nodes). Trong
phân tích mng xã hc bip các tác nhân (actors) hay
tp thc th Trong mng xã hi, tnh u
trúc ca các mng xã hi, các thành viên hay các ct nhóm
th ng th ng
Hình 2.8: Din t th th ng
i v th, mt thành phn quan trrng s ca
cnh. Trng s ca c nh m
hay tn sut liên kt gi th. i vi các bài toán trong lý
thuy th, trng s gii quyt bài toán tìm
n nh th. A
v
B
D
C
E
A
B
D
C
E