KEY PLAYER TRONG
MẠNG XÃ HỘI
Đồ án hết môn CSDL nâng cao
Đồ án trình bày tóm tắt cơ sở lý thuyết về phân tích
mạng xã hội và tìm tập key players thông qua các chỉ số
centrality. Đi kèm với báo cáo là chương trình minh họa có hỗ
trợ chức năng vẽ đồ thị và hỗ trợ tính toán các thông số để
phục vụ việc minh họa cơ sở lý thuyết.
Giảng viên hướng dẫn: PGS. TS. ĐỖ
PHÚC
Học viên thực hiện: Phạm Nguyễn
Trường An
Mục lục
2
CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH MẠNG
XÃ HỘI
Mạng xã hội đang là một hiện tượng trong lĩnh vực công nghệ
thông tin ngày nay. Ngay cả với những người không công tác trong lĩnh
vực công nghệ thông tin cũng khó có thể một tuần (hoặc có lẽ là một
ngày) trôi qua mà bạn không nhận được kết nối của một đồng nghiệp trên
LinkedIn, yêu cầu kết bạn trên Facebook. Vậy mạng xã hội là gì?
Theo Stanley Wasserman và Katherine Faust trong [1] thì mạng xã
hội là “Một cấu trúc xã hội được hình thành từ nhiều tác tử (có thể là các
nhân hoặc tổ chức) và các quan hệ tay đôi giữa những tác tử đó”. Trong
ngữ cảnh giao tiếp thường nhật chúng ta dung lẫn lộn thuật ngữ “mạng xã
hội” để chỉ một trang web cung cấp dịch vụ mạng xã hội. Một trang trang
mạng xã hội nơi mọi người kết nối, trao đổi và chia sẻ trực tuyến. Chúng
ta có thể tìm thấy rất nhiều trang xã hội trên Web ngày nay. Chúng bao
gồm các mạng xã hội (như Facebook và LinkedIn), các trang tin tức xã
hội (Digg và Reddit), và các trang khám phá/đánh dấu (Delicious và
Stumble-Upong). Mỗi trang sở hữu những đặc tính riêng, nhưng hầu hết
eigenvector centrality, alpha centrality and degree centrality[4].
Density: Độ dày của các liên kết trong mạng xã hội. Tính bằng số
liên kết trên tổng số liên kết cần thiết để mạng xã hội tạo thành một đồ thị
đầy đủ (complete graph).
Đường đi (path): Đường đi giữa hai node là danh sách các node kết
nối hai node này. Độ dài đường đi có thể được tính bằng số node hoặc
bằng tổng các trọng số những cạnh nối trong đường đi nếu như đồ thị là
có trọng số
Tie strength: Thể hiện mức độ thân thiết giữa hai tác tử, chỉ số này
thường được mô tả bằng trọng số của cạnh tương ứng trong đồ thị.
Cliques: Clique là một nhóm node bên trong mạng xã hội có tất cả
các đỉnh liên kết trực tiếp đến nhau. Clique thường thể hiện một nhóm
bạn thân thiết hay một nhóm quen biết có cùng một mối quan tâm nào đó.
Các clique thường được đặc biệt chú ý khi phân tích mạng xã hội.
CHƯƠNG 2. KEYPLAYERS.
4
Keyplayes là những tác tử có uy tín cao trong mạng xã hội, có khả
năng tác động và truyền đạt thông tin tới một lượng lớn các tác tử khác.
Đây là những tác tử quan trọng thường được đặc biệt chú ý khi phân tích
mạng xã hội.Đầu tiên, chúng ta sẽ cùng phân tích các độ đo có liên quan
đến việc xác định keyplayes và phương pháp tính các độ đo này.
2.1. Degree centrality:
Trong mạng xã hội thì degree centrality của một tác tử là số lượng
các tác tử có quan hệ với tác tử đang xét. Nói cách khác chính là số bậc
của một đỉnh. Nếu đồ thị của chúng ta là đồ thị có hướng có trọng số,
chúng ta sẽ có hai loại degree centrality là: Degree centrality đến (in-
degree centrality), số đỉnh có cạnh liên kết với dỉnh đang xét. Và Degree
centrality đi (out-degree centrality), số đỉnh mà đỉnh đang xét liên kết
đến.
Degree centrality cho ta biết mức độ nổi tiếng hay mức độ rộng rãi
Một câu hỏi thường được đặt ra là: Ai là người quan trọng nhất
trong mạng xã hội. Tuy nhiên thực tế để xác định duy nhất chỉ một người
quan trọng là rất khó. Đặc biệt là với các mạng xã hội lớn vẫn có trường
hợp một người chơi chính lại không thể liên hệ được với một clique nào
đó trong mạng. Vì thế thông thường chúng ta sẽ xác định tập các người
chơi chính được lấy bằng hội của tập hợp những tác tử có những độ đo
centrality là lớn nhất.
7
CHƯƠNG 3. CHƯƠNG TRÌNH MINH HỌA
Chương trình được nộp chung với lớp trong đĩa CD của lớp trưởng.
Dưới đây là sơ lược về một số định nghĩa và một số độ đo thường
được sử dụng trong phân tích mạng xã hội. Chi tiết hơn về các
8
TÀI LIỆU THAM KHẢO
[1]Wasserman, Stanley; Faust, Katherine (1994). "Social
Network Analysis in the Social and Behavioral Sciences".
Social Network Analysis: Methods and Applications.
Cambridge University Press. pp. 1–27
[2]Pinheiro, Carlos A.R. (2011). Social Network Analysis in
Telecommunications. John Wiley & Sons. p. 4
[3]D'Andrea, Alessia et al. (2009). "An Overview of Methods
for Virtual Social Network Analysis". In Abraham, Ajith et
al Computational Social Network Analysis: Trends, Tools
and Research Advances. Springer. p. 8.
[4]Opsahl, Tore; Agneessens, Filip; Skvoretz, John (2010).
"Node centrality in weighted networks: Generalizing degree
and shortest paths". Social Networks 32 (3): 245.
[5]Granovetter, M. (1973). “The strength of weak ties”. 78. pp.
1360-1380.
[6]Dangalchev Ch., Residual Closeness in Networks, Phisica A