Tổng quan tình hình nghiên cứu, luận giải về mục tiêu và những nội dung nghiên cứu của nhiệm vụ - Pdf 95

15 Tổng quan tình hình nghiên cứu, luận giải về mục tiêu và những nội dung nghiên cứu
của nhiệm vụ
15.1 Đánh giá tổng quan tình hình nghiên cứu thuộc lĩnh vực của nhiệm vụ
15.1.1. Ngoài nước (Phân tích đánh giá được những công trình nghiên cứu có liên quan và những
kết quả nghiên cứu mới nhất trong lĩnh vực nghiên cứu của nhiệm vụ; nêu được những bước tiến
về trình độ KH&CN của những kết quả nghiên cứu đó)
15.1.1.1. Khái niệm mạng xã hội và phương tiện truyền thông xã hội
Nhà xã hội học John Arundel Barnes (người Úc) được coi là một trong những người đầu tiên đưa
thuật ngữ "mạng xã hội" (social network) vào ngữ cảnh nghiên cứu khoa học vào năm 1954
[Barnes54]. Theo David Easley và Jon Kleinberg, 2010 [EK10], mạng xã hội là một cấu trúc xã
hội bao gồm một tập các cá nhân/ tổ chức và một tập các quan hệ xã hội giữa các cá nhân/tổ chức
trong mạng. Mạng xã hội thường được biểu diễn dưới dạng một đồ thị trong đó các cá nhân/tổ
chức được biểu diễn bằng các nút còn các quan hệ xã hội trong mạng được biểu diễn bằng các
cạnh kết nối các nút trong mạng đó. Mạng xã hội trực tuyến (online social network) là mạng xã
hội được thi hành bằng các dịch vụ mạng xã hội trực tuyến (online social network service). Dưới
đây, cụm từ "mạng xã hội" được chỉ "mạng xã hội trực tuyến" nếu không có sự chỉ dẫn riêng.
Khái niệm "phương tiện truyền thông xã hội" (social media) về cơ bản là cùng ý nghĩa và nội
dung với dịch vị mạng xã hội. Thông qua phương tiện truyền thông xã hội, khối lượng nội dung
do người dùng tạo ra (user-generated content: UGC) trở thành thành phần có tỷ trọng lớn nhất
trong tập dữ liệu tổng thể mà con người hiện có.
Jure Leskovec, 2011 [Lesk11] cho rằng phương tiện truyền thông xã hội được thiết kế và thi hành
là để phổ biến tới cộng đồng (community) về các mối quan hệ xã hội. Sheng Yu và Subhash Kak,
2012 [YK12] nhận định rằng phương tiện truyền thông xã hội bao gồm các nền tảng để người
dùng tạo và trao đổi nội dung với cộng đồng người dùng trong mạng. Phương tiện truyền thông xã
hội là đa dạng về hình thức, bao gồm các blog, các trang web mạng xã hội, thế giới xã hội ảo, dự
án hợp tác, cộng đồng nội dung và thế giới trò chơi ảo. Tồn tại phương tiện truyền thông xã hội
mà không bao gói dáng cấu trúc xã hội, chẳng hạn, blogspot.com là một khung nền blog nổi tiếng
nhưng không có liên kết xã hội giữa các blogger. Andreas M Kaplan và Michael Haenlein, 2010
[KH10] cho rằng truyền thông xã hội được hiểu như là "một nhóm các ứng dụng dựa trên Internet
được xây dựng trên nền tảng tư tưởng và công nghệ của Web 2.0, cho phép tạo và trao đổi nội
dung do người dùng tạo ra". Theo các tác giả, thời đại của phương tiện truyền thông xã hội được

Hơn nữa, mạng xã hội hấp dẫn những người trẻ tuổi, những người làm việc trí tuệ là những người
có tính năng động cao trong xã hội và vì vậy, mạng xã hội có tác động rất to lớn tới các cộng đồng
trong xã hội thực.
15.1.1.3. Tác động của mạng xã hội
a) Tác động xã hội
3
Mạng xã hội thừa kế sức quảng bá thông tin của các phương tiện truyền thông truyền thống nhưng
với sức lan tỏa nhanh hơn tới các cộng đồng năng động cao trong xã hội. Vì vậy, tác động xã hội
của mạng xã hội là rất lớn.
Về cơ bản, mạng xã hội góp phần tăng cường nguồn vốn xã hội (social capital) cho quốc gia như
trong nghiên cứu của nhiều tác giả (Nicole B. Ellison và cộng sự, 2007 [ESL07], Homero Gil de
Zúnĩga và cộng sự, 2012 [ZJV12]), tuy nhiên, trong không ít trường hợp, mạng xã hội cũng cản
trở sự phát triển của vốn xã hội.Dưới đây là một ví dụ điển hình về tác động xã hội của mạng xã
hội.
+ Facebook với phong trào "Mùa xuân Ả rập" năm 2011
Tác động của Facebook tới phong trào "Mùa xuân Ả rập" tháng 3 năm 2011 là nội dung nghiên
cứu trong nhiều công bố khoa học, chẳng hạn như Ban Al-Ani và cộng sự, 2012 [AMCJ12],
Elizabeth Iskander, 2011 [Iskan11]. Nhiều tác giả cho rằng Facebook là một trong các yếu tố quan
trọng tạo nên phong trào nnói trên Ai Cập dẫn tới sự sụp đổ của chế độ Tổng thống Mubarak.
Racha Mourtada và Fadi Salem, 2011 [MS11] đưa ra các số liệu thống kê về các hình thức sử
dụng Facebook tại Ai Cập và Tuy-ni-zi trong phong trào “Mùa xuân Ả rập” (Hình 3) và thông kê
này cho thấy việc sử dụng Facebook cho hoạt động liên quan đến phong trào nói trên chiếm một
trọng số rất lớn.
4
Hình 3. Hình thức sử dụng Facebook trong Phong trào Dân sự và sự kiện đầu năm 2011 [MS11]
+ Facebook với cuộc bạo loạn tại Anh năm 2011
Casill, Antonio A. và Paola Tubaro, 2012 [AT12] trình bày một nghiên cứu thực nghiệm mô
phỏng mối liên quan giữa mức độ bạo lực với sự kiểm duyệt Facebook. Kết quả nghiên cứu của
các tác giả cho thấy rằng lời giải tối ưu mang tính hệ thống là giải pháp hoàn toàn không kiểm
duyệt Facebook và trong trường hợp đó, không chỉ giảm được mức độ bạo lực theo thời gian mà

thành phương tiện truyền thông hữu dụng để những người gặp nguy cấp gửi thông điệp cầu cứu
ngắn tới bạn bè và các tổ chức cứu trợ. Twitter cũng truyền đạt lại các thông điệp tư vấn, hướng
dẫn trợ giúp thông tin cho những người khẩn cấp. Trong trường hợp đó, thông tin định vị thiết bị
gửi thông điệp của người kêu cứu được sử dụng để hướng dẫn người đó tới các đia điểm an toàn
hoặc địa điểm có sự trợ giúp. Takeshi Sakaki và cộng sự, 2011 [STM11], Nigen Collier, Son Doan
và cộng sự, 2011 [CD11, DVC11] đề xuất các phương án nhận thông đệp cầu cứu của người dùng
và gửi thông điệp tư vấn tới người dùng thông qua Twitter.
b) Tác động khoa học
Sự phát triển của các mạng xã hội trực tuyến kéo theo sự hình thành các chủ đề mới trong một số
ngành khoa học mà điển hình là xã hội học và khoa học máy tính.
+ Ngành xã hội học
Theo Robert E. Wilson và cộng sự, 2012 [WGG12], nghiên cứu xã hội học dựa trên Facebook
định hướng tới năm nhóm chủ đề là Phân tích mô tả người sử dụng, Động lực sử dụng Facebook,
Trình bày danh tính, Vai trò của Facebook trong tương tác xã hội, Tính riêng tư và việc tiết lộ
thông tin.
Thêm nữa, mạng xã hội thúc đẩy những chủ đề nghiên cứu mới như "Netnography" = “Inter[net]”
and “eth[nography]”, "Child-led Research" trong xã hội học. Netnography cung cấp thông tin
về các mẫu biểu tượng, các mẫu ngữ nghĩa và các mẫu tiêu dùng của nhóm người mua trực tuyến
hoặc việc tiêu dùng của cộng đồng trực tuyến không quan hệ với nhau ngoại trừ sự trao đổi thông
tin trên mạng xã hội trực tuyến. Child-led Research để chỉ các hoạt động tạo cho các nhóm người
bất lực một cách tương đối (tuổi vị thành niên, khuyết tật) thiết lập được các chương trình nghị sự
và dẫn dắt nghiên cứu của riêng họ.
+ Khai phá dữ liệu
Cliff Lampe và cộng sự, 2012 [LVGE12], Facebook (tổng quát hóa là mạng xã hội trực tuyến) có
vai trò của một nguồn tài nguyên thông tin , và vì vậy, mạng xã hội trực tuyến chứa đựng một
nguồn dữ liệu với dung lượng lớn và rất có giá trị.
Sự phát triển của khai phá dữ liệu phương tiện truyền thông xã hội và mối quan hệ liên ngành giữa
công nghệ thông tin và xã hội học. Một số nội dung điển hình nhất về khai phá dữ liệu phương
6
tiện truyền thông xã hội có trong phần tiếp theo.

http://www.larc.smu.edu.sg/
7
xã hội (Social media marketing), phản ứng công dân (citizen response), phân tích hành vi con
người (Human behavior analysic), phóng viên công dân thời gian thực (Real time citizen
journalist) và rất nhiều ứng dụng khác.
Chẳng hạn, Craig Macdonald và cộng sự, 2010 [MSOS10] cho một phân tích về các nghiên cứu
khai phá dữ liệu blogs trong khuôn khổ TREC giai đoạn 2006-2009 đối với ba bài toán: phát hiện
quan điểm (opinion-finding) đối với một đối tượng ("Người sử dụng blogs nghĩ gì về đối tượng X
đã cho ? "), chưng cất blog (blog distillation) để tìm ra các blog quan tâm tới đối tượng X ("Tìm
blog quan tâm chính, định kỳ tới đối tượng X ?") và phát hiện tin nổi bật (top news) từ blogs ("tìm
các tin có giá trị gần đây nhất ?"). Hàng chục công trình nghiên cứu tham gia TREC-Blogs Track
cung cấp một phổ rộng lớn các giải pháp khai phá dữ liệu để giải quyết ba bài toán nói trên. Theo
các tác giả, bài toán phát hiện quan điểm (bài toán đầu tiên) từ blogs không có nhiều khác biệt so
với bài toán khai phá quan điểm nói chung.
Chúng ta xem xét một nghiên cứu khác về khai phá dữ liệu microblogs của Huina Mao và cộng sự,
2011 [MCB11]. Đặc thù về độ dài thông điệp ngắn, về cấu trúc liên kết thành viên và thông điệp
tạo ra một số yếu tố bổ sung cho khai phá dữ liệu nội dung từ microblogs. Tính cập nhật thông tin
nhanh trên microblogs là tiền đề cho các giải pháp dự báo ngắn hạn trên microblogs. Trong
[MCB11], Huina Mao và cộng sự cung cấp một khảo sát công phu về các chỉ số tâm trạng của nhà
đầu tư chứng khoán gồm có tỷ lệ phần trăm tăng giá DSI (DSI bullish percentage: DSI), chỉ số
thông minh của nhà đầu tư (Investor Intelligence: II), đánh giá nhà đầu tư Twitter (Twitter
Investor Sentiment: TIS), lượng thuật ngữ tìm kiếm tài chính Twest (Tweet volumes of financial
search terms: TV-FST), đánh giá tin tức tiêu cực (Negative News Sentiment: NNS), và lượng tìm
kiếm Google của các thuật ngữ tài chính (Google search volumes of financial search terms: GIS).
Qua thực nghiệm theo thời gian một tuần, các tác giả phát hiện rằng GIS có độ liên quan đáng kể
với các chỉ số tài chính phân biệt (different financial indexes: DJIA) và như vậy GIS có thể thay
thế các chỉ số dự báo tài chính. Tuy nhiên, đối với chỉ số thông minh nhà đầu tư (II) thì không có
được vai trò đó. Độ chính xác của dự báo có thể cải thiện khi làm giàu đặc trưng. Thực nghiệm
theo thời gian ngày cho thấy TIS và TV-FST cho phép dự báo tốt đáng kể theo thống kê về hoàn
vốn thị trường hàng ngày trong khi DSI thì không cho phép. NNS cũng cho kết quả theo chiều

quả hơn.
15.1.1.6. Nghiên cứu về khai phá dữ liệu mạng xã hội tại một số tổ chức, nhóm nghiên cứu
a) Nghiên cứu tại Viện Tiêu chuẩn và Công nghệ quốc gia Mỹ
Viện Tiêu chuẩn và Công nghệ quốc gia Mỹ (National Institute of Standards and Technology:
NIST) tiến hành nhiều hội nghị khoa học về các chủ đề khoa học – công nghệ được quan tâm của
9
nước Mỹ và thế giới. Chuỗi hội nghị về “thu hồi” văn bản (Text REtrieval Conference: TREC) do
NIST và Bộ Quốc phòng Mỹ phối hợp tổ chức với sự tham gia của cộng đồng nghiên cứu và triển
khai về thu hồi thông tin (Information Retrieval) trên thế giới.
Liên quan tới nội dung đề tài, đã diễn ra một số hội nghị bộ phận (Track) trong khuôn khổ của hội
nghị TREC sau đây:
- Blog Track 2010. Craig Macdonald và cộng sự, 2010 [MSOS10] cung cấp một mô tả khái
quát kho ngữ liệu được sử dụng (Blogs06 và Blogs08), kết quả nghiên cứu của 45 nhóm
nghiên cứu về thu hồi thông tin trên Blogsphore đối với ba bài toán Phát hiện quan điểm
(Opinion-Finding), Tìm kiếm blog thú vị (Blog Distillation) và Phát hiện tin nóng (Top
news). Những giải pháp cho ba bài toán Phát hiện quan điểm (dựa theo phân lớp, dựa theo từ
vựng), Tìm kiếm blog thú vị (tiếp cận lựa chọn tài nguyên, tiếp cận tìm kiếm chuyên gia),
Phát hiện tin nóng (phương pháp bỏ phiếu, phương pháp xếp hạng) được Craig Macdonald và
cộng sự tổng hợp từ các công bố cụ thể của 45 nhóm nghiên cứu đã và đang được nhóm thực
hiện đề tài nghiên cứu triển khai thử nghiệm và có kết quả sơ bộ.
- Microblog Track 2011, 2012 (https://sites.google.com/site/microblogtrack/2011-guidelines,
https://sites.google.com/site/microblogtrack/2012-guidelines). NIST tạo ra 60 chủ đề cho bài
toán này và những người tham gia giải quyết bài toán trong thời gian thực. Số lượng tweest
mỗi ngày lên tới 200 triệu, yêu cầu thời gian thực là những thách thức rất lớn trong việc tìm
kiếm và xếp hạng tweest. Các giải pháp công bố tại Microblog Track năm 2011 sẽ được
nhóm thực hiện đề tài khảo sát để áp dụng
(http://trec.nist.gov/pubs/trec20/t20.proceedings.html). Công trình nghiên cứu của Richard M.
C. McCreadie và cộng sự, 2012 [CSMOC12] cũng sẽ được nhóm thực hiện đề tài khảo sát để
áp dụng trong việc xây dựng và nâng cấp kho ngữ liệu (scopus) cho các bài toán trong phạm
vi đề tài.

qua các loại thông tin phản hồi khác nhau, và qua đó tạo ra dữ liệu cho pha Quan sát của vòng kín
tiếp theo.
Bùng nổ sự kiện là một chủ đề nghiên cứu tại LARC với các nghiên cứu của Wayne Xin Zhao và
cộng sự, 2011 [ZJHS11], Wayne Xin Zhao và cộng sự, 2012 [ZSJSL12], Qiming Dia và cộng sự,
2012 [DJZL12]. Hiện tại Phòng Thí nghiệm Công nghệ Tri thức có hai thành viên (HVCH
Nguyễn Thanh Sơn, HVCH Trần Xuân Tứ) đang thực tập khoa học tại LARC về trích xuất sự kiện
và dự báo bùng nổ sự kiện.
15.1.1.7. Phát hiện vai trò và dự báo bùng nổ sự kiện trong mạng xã hội
Phần dưới đây trình bày một số nội dung cơ bản và điển hình nhất về bài toán phát hiện vai trò và
bùng nổ sự kiện trên các mạng xã hội trực tuyến, các mô hình, giải pháp của cộng đồng nghiên
cứu trên thế giới về trích chọn thông tin, phát hiện vai trò và bùng nổ sự kiện trên các mạng xã hội
trực tuyến.
Mạng xã hội không thừa kế mối quan hệ trong xã hội thực của các thành viên, tuy nhiên, thông tin
về hành vi và nội dung thông điệp trao đổi trong mạng xã hội cho phép phát hiện các mối quan hệ
giữa các thành viên trong mạng bao gồm mối quan hệ trong xã hội thực lẫn mối quan hệ nảy sinh
trong ngữ cảnh mạng xã hội. Đây là xuất xứ của bài toán phát hiện vai trò trong mạng xã hội.
Chi Wang và cộng sự, 2010 [WHJTZ10] đề xuất mô hình đồ thị nhân tử xác suất phụ thuộc thời
gian (Time-constrained probabilistic factor graph model: TPFG) để phát hiện quan hệ người
hướng dẫn – người được hướng dẫn trong mạng thông tin được hình thành từ Cơ sở dữ liệu
DBLP. Kết quả nghiên cứu này đã được thi hành trong hệ thống tìm kiếm và khai phá dữ liệu
mạng xã hội khoa học Arnetminer (http://arnetminer.org/) của Trường Đại học Thanh Hoa Trung
Quốc.
Trong nhiều trường hợp, giải pháp tính hạng (ranking) cũng được áp dụng trong bài toán phát hiện
vai trò, trong đó những nút mạng (cá nhân/tổ chức) có hạng cao là những nút quan trọng trong
mạng xã hội. Hành vi của những nút quan trọng có tác động tới hành vi chung của mạng hoặc một
cộng đồng trong mạng. Sự bùng nổ sự kiện trong mạng xã hội có liên quan tới hành vi của những
nút quan trọng trong mạng.
Vanesa Junquero-Trabado và David Dominguez-Sal [TS12] đề xuất một kiến trúc cho hệ thống
tìm kiếm vai trò từ những người dùng phương tiện xã hội. Các tác giả định nghĩa 14 đặc trưng cần
12

nghiệp với YouTube và 0,2% doanh nghiệp với mọi mạng xã hội còn lại. Nguyen Huu Chi và
13
Christophe J. Nordman [CN12] làm sáng tô mối liên hệ giữa mạng xã hội hộ gia đình, kinh doanh
hộ gia đình với hiệu quả kinh doanh hộ gia đình phi nông nghiệp. Ngoài một số mối tương quan
khác, các giả nhận thấy cộng đồng kinh doanh hộ gia đình có tác dụng tới hiệu quả kinh doanh hộ
gia đình.
* Nghiên cứu về phát hiện vai trò và bùng nổ sự kiện trong mạng xã hội
Tại các tổ chức thực hiện và phối hợp thực hiện đề tài (tập trung tại Phòng Thí nghiệp Công nghệ
Tri thức), một số nghiên cứu bước đầu về phát hiện vai trò và bùng nổ sự kiện trong mạng xã hội
đã được thực hiện. Một số kết quả nghiên cứu trực tiếp và gián tiếp liên quan tới hai nội dung
nghiên cứu của đề tài mà nhóm thực hiện đề tài đã thực hiện sẽ được trình bày chi tiết hơn ở phần
tiếp theo.
Ngoài các nghiên cứu liên quan tại các tổ chức thực hiện đề tài, chúng tôi chưa thấy các công bố
khoa học có giá trị liên quan tới phát hiện vai trò và bùng nổ sự kiện trong mạng xã hội tại Việt
Nam.
15.1.2.2. Tình hình nghiên cứu của nhóm thực hiện đề tài
a) Lọc nội dung trên Internet
14
Hình 5. Kiến trúc hệ thống lọc nội dung trên Internet [HNNL11]
Trong giai đoạn 2007-2009, chủ trì đề tài Nguyễn Lương Hoàng Hoa cùng nhiều thành viên tham
Firewall
Bộ kiểm soát
Bộ xác định
ngôn ngữ
Bộ lọc tiếng
Anh
Bộ lọc tiếng
Việt
Bộ phân tích nội dung
Bộ ra

quả nghiên cứu về khai phá quan điểm [QTHC11, THCQ11, HTMQ11], theo đó từ một tập nhận
xét đánh giá sản phẩm của người dùng, cần trích xuất ra đánh giá của từng người dùng theo từng
đặc trưng của sản phẩm và sau đó là tích hợp lại. Mô hình Trích xuất và tổng hợp quan điểm theo
đặc trưng từ đánh giá sản phẩm được thể hiện tại Hình 6.
16
Hình 6. Trích xuất và tổng hợp quan điểm theo đặc trưng từ đánh giá sản phẩm [QTHC11,
THCQ11, HTMQ11]
Các giải pháp trích chọn đặc trưng sản phẩm cũng như quan điểm của người dùng về đặc trưng đó
rất hưu dụng khi giải quyết bài toán phát hiện sự kiện cùng các đặc trưng liên quan tới sự kiện đó
mà sẽ được thi hành trong hệ thống xác định vai trò và bùng nổ sự kiện trong mạng xã hội.
c) Dự báo chứng khoán từ dữ liệu Twitter
Tien Thanh Vu và cộng sự, 2012 [TSQN12] đề xuất một phương pháp lai dạy chuỗi mô hình dự
báo thay đổi phân cực giá mở cửa thị trường bốn cổ phiếu công nghệ Apple (AAPL), Google
(GOOG), Microsoft (MSFT) và Amazon (AMZN) như trình bày tại Hình 7.
Dữ liệu gồm 5.001.460 tweet của người dùng hàng ngày tại bốn thành phố của nước Mỹ (New
York, Chicago, Los Angeles và San Francisco) được thu thập nhờ công cụ giao diện trình ứng
dụng Twitter trực tuyến trực tiếp API từ ngày 01/4/2011 đến ngày 31/5/2011. Ba nhóm đặc trưng
(đánh giá tích cực – tiêu cực, độ tin cậy của khách hàng vào cổ phiếu, sự lên-xuống của cổ phiếu
trong ba ngày trước đó) được sử dụng trong phân lớp cây quyết định (C4.5) Tree cho độ chính xác
82,93%, 80,49%, 75,61% và 75,00% khi dự báo thay đổi lên - xuống hàng ngày của Apple
17
(AAPL), Google (GOOG), cổ phiếu Microsoft (MSFT) và Amazon (AMZN).
Hình 7. Mô hình dự báo sự lên – xuống của thị trường chứng khoán từ Twitter [TSQN12]
Công trình nghiên cứu này trực tiếp khai thác dữ liệu từ mạng xã hội Twitter vì vậy cung cấp một
nền tảng tri thức miền ứng dụng đối với đề tài sẽ được thực hiện. Không những thế, một số kỹ
thuật trích chọn đặc trưng cụ thể cho miền dữ liệu này sẽ được tái sử dụng và nâng cấp trong quá
trình thực hiện đề tài.
d) Giám sát sự kiện từ phương tiện truyền thông xã hội
18
Hình 8. Hệ thống giám sát sự kiện VnLoc [MMSMX12]

là những cá nhân có vai trò quan trọng trong việc hình thành và phát triển sự kiện cũng như sự
bùng nổ sự kiện. Vì vậy, việc phát hiện vai trò của các cá nhân trong mạng xã hội cần được tiến
hành như là giải pháp tiền đề của dự báo bùng nổ sự kiện trên mạng xã hội. Những giải pháp của
Chi Wang và cộng sự [WHJTZ10], của Vanesa Junquero-Trabado và David Dominguez-Sal
[TS12] định hướng cho các giải pháp của nhóm thực hiện đề tài. Một trường hợp riêng của dự báo
bùng nổ sự kiện là bùng nổ sự kiện có liên quan tới một cá nhân, một nhóm cá nhân thuộc bốn lớp
vai trò trên cũng cần được quan tâm giải quyết trong đề tài.
Hoạt động phối hợp nghiên cứu khoa học – triển khai công nghệ của nhóm thực hiện đề tài với
nhóm của GS. Nigel Collier tại Viện Tin học Quốc gia Nhật Bản, với nhóm nghiên cứu của GS.
Lim Ee Peng (Trung tâm nghiên cứu phân tích cuộc sống: LARC) tại Đại học Quản lý Singapore,
với nhóm nghiên cứu của GS. Bart Baesens tại Đại học KU Leuven (Bỉ) cũng cần được khai thác
cho các giải pháp của đề tài.
Như đã được luận giải, để giải quyết được các bài toán phát hiện vai trò và dự báo bùng nổ sự
kiện trên mạng xã hội, các bài toán thu thập dự liệu từ mạng xã hội, tiền xử lý dữ liệu và trích
chọn thông tin từ văn bản cần được giải quyết. Kinh nghiệm của nhóm nghiên cứu trong các chủ
đề này sẽ được vận dụng hiệu quả trong quá trình thực hiện đề tài.
Phát hiện vai trò và dự báo bùng nổ sự kiện trong mạng xã hội là các bài toán khó, đnag là các
chủ đề khoa học – công nghệ thời sự trên thế giới. Trong mỗi miền ứng dụng cụ thể, sự cộng tác
của các chuyên gia miền ứng dụng (các chuyên gia nghiệp vụ) sẽ cần được khai thác để hệ thống
21
sản phẩm của đề tài đạt hiệu quả tốt nhất trong miền ứng dụng đó. Sự cộng tác trong nhóm thực
hiện đề tài từ cơ quan chủ trì đề tài và cơ quan phối hợp thực hiện đề tài sẽ là một giải pháp thi
hành nội dung này.
Tính thời sự của đề tài, phát huy các kết quả nghiên cứu đã có và phát triển hợp tác KH-CN quốc
tế đang có là các tiền đề để các giải pháp được đề xuất trong quá trình thực hiện đề tài đáp ứng
yêu cầu công bố khoa học quốc tế (01 bài) và quốc gia (01 bài), đồng thời, sản phẩm hệ thống
phần mềm đáp ứng yêu cầu dự báo bùng nổ sự kiện trêng mạng xã hội hỗ trợ hoạt động nghiệp vụ.
16 Liệt kê danh mục các công trình nghiên cứu, tài liệu có liên quan đến đề tài đã trích dẫn
khi đánh giá tổng quan
16.1. Các công trình khoa học liên quan tới nội dung đề tài của các tác giả khác

13. [EK10] David Easley and Jon Kleinberg (2010). Networks, Crowds, and Markets: Reasoning
about a Highly Connected World, Cambridge University Press, 2010.
14. [ESL07] Nicole B. Ellison, Charles Steinfield, Cliff Lampe (2007). The Benefits of Facebook
"Friends: "Social Capital and College Students' Use of Online Social Network Sites, J. Computer-
Mediated Communication 12(4): 1143-1168 (2007).
15. [HSYY10] Jiawei Han, Yizhou Sun, Xifeng Yan, Philip S. Yu (2010). Mining Knowledge from
Databases: An Information Network Analysis Approach, ACM SIGMOD Conference Tutorial, 2010.
16. [HWNC11] Andrew Bengry-Howell, Rose Wiles, Melanie Nind, Graham Crow (2011). A Review
of the Academic Impact of Three Methodological Innovations: Netnography, Child-Led Research and
Creative Research Methods, ESRC National Centre for Research Methods,
http://eprints.ncrm.ac.uk/1844/
17. [Iskan11] Elizabeth Iskander (2011). Connecting the National and the Virtual: Can Facebook
Activism Remain Relevant After Egypt’s January 25 Uprising?, International Journal of
Communication 5 (2011): 1225–1237.
18. [KH10] Andreas M Kaplan and Michael Haenlein (2010). Users of the world, unite! The
challenges and opportunities of Social Media, Business horizons (2010), 53:59-68.
19. [Lesk08] Jure Leskovec (2008). Dynamics of large networks, PhD Thesis, Carnegie Mellon
University.
20. [Lesk11] Jure Leskovec (2011). Social Media Analytics, Tutorial at the ACM SIGKDD
International Conference on Knowledge Discovery and Data Mining (Part 1: Information flow, Part2:
Rich Interactions), 2011.
21. [LHK10] J. Leskovec, D. Huttenlocher, J. Kleinberg (2010). Predicting Positive and Negative
Links in Online Social Networks, WWW’2010, ACM Press, New York.
22. [LVGE12] Cliff Lampe, Jessica Vitak, Rebecca Gray, Nicole B. Ellison (2012). Perceptions of
facebook's value as an information source, CHI 2012: 3195-3204
23. [LZ10] L. Lu and T. Zhou (2010). Link prediction in complex networks: A survey, Physica A,
390:1150–1170, 2010.
24. [MCB11] Huina Mao, Scott Counts, Johan Bollen (2011). Predicting Financial Markets:
Comparing Survey, News, Twitter and Search Engine Data, CoRR abs/1112.1051: (2011),
arXiv:1112.1051v1 [q-fin.ST] 5 Dec 2011.

(2011). Mô hình giải pháp lọc nội dung hỗ trợ quản lý và đảm bảo an toàn – an ninh trên Internet,
Chuyên san các công trình nghiên cứu, phát triển và ứng dụng CNTT & Truyền thông, V-1 (6/26): 260-
270, 9-2011.
2. [DMTQ11] Duc-Trong Le, Mai-Vu Tran, Tri-Thanh Nguyen, Quang-Thuy Ha (2011). Co-
reference Resolution in Vietnamese Documents Based on Support Vector Machines, IALP 2011: 89-
93, Penang, Malaysia.
3. [HMNNQ11] Hoang-Quynh Le, Mai-Vu Tran, Nhat-Nam Bui, Nguyen-Cuong Phan, Quang-Thuy
Ha (2011). An Integrated Approach Using Conditional Random Fields for Named Entity Recognition
24
and Person Property Extraction in Vietnamese Text, IALP 2011 :115-118, Penang, Malaysia.
4. [HTMQ11] Huyen-Trang Pham, Tien-Thanh Vu, Mai-Vu Tran, Quang-Thuy Ha (2011). A
Solution for Grouping Vietnamese Synonym Feature Words in Product Reviews, IEEE APSCC’2011:
503-508, Jeju, Korea.
5. [MMSMX12] Mai-Vu Tran, Minh-Hoang Nguyen, Sy-Quan Nguyen, Minh-Tien Nguyen, Xuan-
Hieu Phan (2012). VnLoc: A Real–time News Event Extraction Framework for Vietnamese,
KSE'2012:161-166, Da Nang, August 17-19, 2012.
6. [MTTH10] Mai-Vu Tran, Tien-Tung Nguyen, Thanh-Son Nguyen, Hoang-Quynh Le (2010).
Automatic Named Entity Set Expansion Using Semantic Rules and Wrappers for Unary Relations,
IALP 2010: 170-173, Harbin, Heilongjiang China; December 28-30, 2010.
7. [MXH10] Mai-Vu Tran, Xuan-Tu Tran, Huy-Long Uong (2010). "User Interest Analysis with
Hidden Topic in News Recommendation System, IALP 2010: 211-214, Harbin, Heilongjiang China;
December 28-30, 2010.
8. [NKQ10] Nam-Khanh Tran, Kim-Cuong Pham, Quang-Thuy Ha (2010). XPath-Wrapper
Induction for Data Extraction, IALP 2010 (Harbin, Heilongjiang China; December 28-30, 2010): 150-
153.
9. [NNH09] Huong-Thao Nguyen, Phuong-Thai Nguyen, Quang-Thuy Ha, and Le-Minh Nguyen
(2009). Vietnam Noun Phrase Chunking based on Conditional Random Field, The First International
Conference on Knowledge and System Engineering (KSE): 172-178, Hanoi, Vietnam, 2009.
10. [OCT09] Tran Thi Oanh, Le Anh Cuong, Ha Quang Thuy and Quynh Hoang Le (2009). An
Experimental Study on Vietnamese POS tagging, International Conference on Asian Language


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status