TIỂU LUẬN CƠ SỞ DỮ LIỆU NÂNG CAO TÌM HIỂU MẠNG XÃ HỘI VÀ NEO4J - Pdf 26

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BÀI THU HOẠCH
CƠ SỞ DỮ LIỆU NÂNG CAO
ĐỀ TÀI
TÌM HIỂU MẠNG XÃ HỘI VÀ NEO4J
TÌM HIỂU MẠNG XÃ HỘI VÀ NEO4J
GVHD: PGS.TS. ĐỖ PHÚC
HỌC VIÊN: NGUYỄN THỊ THANH THẢO
MÃ SỐ: CH1101137
KHÓA: 6
Tp Hồ Chí Minh, tháng 08 năm 2012
Mục lục
Lời nói đầu 3
PHẦN 1: MẠNG XÃ HỘI 4
I.Giới thiệu về mạng xã hội 4
II.Ứng dụng thực tế của mạng xã hội 5
III.Những thành phần cơ bản của mạng xã hội 6
PHẦN 2: TÌM HIỂU NEO4J 10
I.Giới thiệu về Neo4j 10
II.Tính năng của Neo4j 10
III.Các thành phần của cơ sở dữ liệu đồ thị Neo4j 10
IV.Cài đặt Neo4j 12
KẾT LUẬN 12
TÀI LIỆU THAM KHẢO 13
Lời nói đầu
Ngày nay khoa học ngày càng phát triển, công nghệ thông tin trở thành
công cụ không thể thiếu trong các lĩnh vực khoa học và đời sống. Nhu cầu của
người dùng sử dụng internet ngày càng nhiều. Công nghệ hiện đại giúp con người
có những tư tưởng, sở thích, tương đồng nhau có thể trao đổi thông tin với nhau
nhiều hơn đó chính là mạng xã hội.

dòng tin rồi cùng lan truyền dòng tin đó.
Mạng xã hội đề cập đến một tập hợp các phần tử (thành viên) và các quan
hệ liên kết giữa chúng.
Mạng lưới xã hội là một tập hợp các mối quan hệ giữa các thực thể xã hội
gọi chung là các tác nhân (actor). Các thực thể xã hội này không nhất thiết chỉ là
các cá nhân mà còn là các nhóm xã hội, các tổ chức, các thiết chế, các công ty xí
nghiệp và cả các quốc gia. Các mối quan hệ giữa các tác nhân (actor) cũng có thể
mang nhiều nội dung khác nhau từ sự tương trợ, trao đổi thông tin cho đến việc
trao đổi hàng hóa, trao đổi các dịch vụ,…
Từ các thông tin trên về mạng xã hội, chúng ta chọn mẫu, thu thập và xử lý
dữ liệu (data). Các khái niệm, các lý thuyết nhằm mô tả và phân tích các mối quan
hệ giữa các tác nhân trong mạng lưới, các qui luật hình thành và biến chuyển của
các mối quan hệ và những ảnh hưởng của các mối quan hệ xã hội đối với hành vi
của các tác nhân. Các mối quan hệ trong mạng xã hội là một dạng của cơ sở dữ
liệu quan hệ (relational data).
Một yếu tố liên quan đến các mối quan hệ trong mạng xã hội:
- Mối quan hệ yếu là các mối quan hệ không chiếm nhiều thời gian
của tác nhân, ít nội dung, cường độ tác động yếu và sự tin cậy lẫn nhau không cao.
- Mối quan hệ mạnh là các mối quan hệ chiếm nhiều thời gian của các
tác nhân, đa nội dung, sự tin cậy và cường độ tác động đến các tác nhân khác rất
cao.
Nhìn chung, các mối quan hệ mạnh có một nhược điểm lớn là thường tự
khép kín trong mạng lưới của mình, và do tác nhân thường dành nhiều thời gian
cho các mối quan hệ này nên thông tin truyền đi trong mạng thường có tính lặp lại
và ít mới mẻ.
Nhưng ngược lại các mối quan hệ yếu lại thường đa dạng hơn, thời gian
quan hệ ít nên thông tin sẽ phong phú và mới mẻ hơn. Các mối quan hệ yếu mới là
yếu tố chính làm tăng thông tin trong mạng xã hội chứ không phải là các mối quan
hệ mạnh, bởi nó sẽ giúp mở rộng mạng lưới xã hội của cá nhân. Khi xét về sự tin
cậy lẫn nhau như một yếu tố thuộc vốn xã hội thì các mối quan hệ mạnh lại có

hệ giữa các actor sẽ là các mối "quan hệ mạnh" (The Strong ties).
6. Undirected (vô hướng): được dùng để chỉ các tác nhân có quan
hệ qua lại (2 chiều) với nhau.
7. Directed (có hướng): được dùng để chỉ các tác nhân chỉ có một
quan hệ (1 chiều) truyền tin hoặc nhận tin.
8. Key Player (tác nhân chính): dùng để chỉ tác nhân có tầm ảnh
hưởng lớn trong mạng toàn mạng xã hội. Tác nhân này trung tâm nhận và truyền
tải thông tin đến tất cả các tác nhân khác.
Các hệ số đo lường tính Key Player.
- Degree centrality ( Hệ số trung tâm trực tiếp)
Hệ số này sẽ giúp chúng ta đo lường được số lượng của các mối quan hệ
trực tiếp của một tác nhân nào đó với các thành viên khác trong mạng xã hội. Giá
trị của hệ số này chạy từ 0.00 đến 1.00 và khi giá trị càng gần tới 1.00 thì tính
trung tâm trực tiếp của tác nhân càng lớn. Công thức tính như sau:
Trong đó:
Deg(v): tổng số các liên kết trực tiếp của tác nhân v
n: tổng số tác nhân trong toàn mạng
- Closeness centrality ( Hệ số trung tâm lân cận)
Điểm yếu của hệ số trung tâm trực tiếp là nó chỉ tính các mối quan hệ trực
tiếp của tác nhân mà thôi nên chưa chắc tác nhân có hệ số trung tâm trực tiếp cao
là người "gần gũi" với mọi thành viên khác trong mạng. Tính gần gũi hay lân cận
cũng là một trong những tiêu chí quan trọng thể hiện vị thế của tác nhân trong
mạng, bởi một tác nhân càng gần gũi với các thành viên trong mạng xã hội bao
nhiêu thì tác nhân đó càng dễ có nhiều thông tin, càng có nhiều uy thế và do đó
càng dễ gây ảnh hưởng lên toàn bộ mạng xã hội. Công thức tính hệ số này như
sau:
Trong đó:
σ
st
= là tổng shortest path từ đỉnh s đến đỉnh t của toàn network

D
(V))
Min(C
C
(V))
9. Pendent (tác nhân phụ): được dùng để chỉ các tác nhân nào đó
chỉ liên kết với một mạng lưới thông qua một đường liên kết duy nhất. Những tác
nhân gắn kết với mạng xã hội bằng một liên hệ phụ gọi là Peripheral Player (người
bên lề).
10. Density/ Cohesion ( Hệ số gắn kết của mạng lưới )
Để phân biệt mạng xã hội nào là mạnh, mạng xã hội nào yếu, mạng xã hội
nào hiệu quả hơn mạng xã hội nào? Trong phân tích mạng xã hội có rất nhiều hệ
số để so sánh các mạng xã hội với nhau và một trong những hệ số quan trọng nhất
đó là "hệ số gắn kết" của mạng xã hội. Khi hệ số cố kết của mạng lưới càng lớn,
mức độ gắn kết, sự chặt chẽ của các mối quan hệ giữa các tác nhân trong mạng
lưới cũng càng lớn, và do đó, sự tương trợ, hỗ trợ… giữa các tác nhân cũng càng
nhiều, càng hiệu quả hơn, sự điều tiết của mạng xã hội đối hành vi của tác nhân
cũng mạnh mẽ hơn và ngược lại.
Một cách tổng quát, tính cố kết của mạng lưới là tỷ lệ giữa tổng các mối
liên hệ thực tế trong mạng lưới và tổng các mối quan hệ lý thuyết của nó (tức là
tổng các mối quan hệ có thể có của mạng). Công thức tính như sau:
2/)1( −nn
k
Trong đó:
k: tổng các đường liên kết thực tế của toàn mạng
n: tổng các tác nhân (degree/actor) trong mạng xã hội
n(n-1)/2: tổng các mối liên kết lý thuyết trong mạng xã hội
Giá trị của hệ số này chạy từ 0.00 - 1.00. Càng gần tới 1.00 thì tính gắn kết
của mạng xã hội càng mạnh và do đó sự truyền nhận thông tin giữa các thành viên
trong mạng xã hội được diễn ra càng tốt và ngược lại.

không hữu ích trong ứng dụng.
Lưu ý rằng một nút có thể có mối quan hệ với chính nó.
3. Roperties ( các thuộc tính )
Cả nút và các mối quan hệ có thể có các thuộc tính.
Thuộc tính là các cặp giá trị quan trọng.
Các kiểu dữ liệu của thuộc tính.
Loại Mô tả Phạm vi
Boolean True/ False
Byte 8 bit số
nguyên
-128 đến 127
Short 16 bit số
nguyên
- 32768 đến 32767
Int 32 bit số
nguyên
-2147483648 đến 2147483647
Long 64 bit số
nguyên
-9223372036854775808 đến9223372036854775807
Float 32-bit
IEEE 754
Double 64-bit
IEEE
754
Char 16-bit
unsigned
số
nguyên
đại diện

hoạch tìm hiểu về mạng xã hội và Neo4j cơ bản đã tìm hiểu được những khái niệm
tổng quát về mạng xã hội và Neo4j.
Tuy nhiên, do thời gian còn hạn chế nên tác giả cũng chưa tìm hiểu hết các
tính năng cũng như các ứng dụng trong Neo4j.
TÀI LIỆU THAM KHẢO
1. PGS.TS Đỗ Phúc, Bài giảng Cơ sở dữ liệu nâng cao, Trường
ĐHCNTT, 2011
2.
3. Các tài liệu về mạng xã hội trên internet.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status