投稿日: その他 論文紹介

Measuring Pair-Wise Social Influence in Microblog

Zibin Yin
Ya Zhang
In Proc. of SocialCom 2012

概要

Weibo上でのリツイートのモデル化を提案。提案モデルを使うことで、ユーザAのツイートがフォロワーのユーザBにリツイートされる確率を計算したり、Weibo上で影響力の大きいユーザを求めたりすることが可能になる。

モデル

ユーザAのツイートが、フォロワーのユーザBにリツイートされるかは、以下の3要素によって決まると仮定。

  • ユーザBのactivity level
  • ユーザBの一定期間中のツイートの多さをBのactivity levelとする。この値が大きいほど、Bは積極的にWeiboを使用しており、結果としてAのツイートを目にする確率が高くなり、リツイートされる確率も高くなると考える。

  • ユーザBのwillingness to retweet
  • ユーザBの一定期間中のツイートに占めるリツイートの割合をBのwillingness to retweetとする。この値が大きいほど、Bはリツイートに対して積極的であり、結果としてAのツイートがリツイートされる確率も高くなると考える。

  • ユーザAのBに対する影響力
  • AのツイートをBがリツイートする確率を、activity level、willingness to retweet、AのBに対する影響力、を用いて定式化。訓練データを与えることで、Bのリツイートの行動を最も精度高く推定できるように、AのBに対する影響力を求める。AのBに対する影響力は期間に依存せず、一定であると仮定。

リツイートの確率予測

訓練データを用いてユーザAのBに対する影響力を学習し、その値を用いてテストデータ中でAのツイートをBがリツイートする確率を予測して、実際の確率との誤差を計算。
active levelとwillingness to retweetを求める際の期間を30日、15日、10日、5日と変えたところ、5日のときが最も誤差が小さくなった。

影響力のあるユーザの発見

ユーザ間の影響力を枝の重みとするグラフを全ユーザを対象に作成してPageRankを適用することで、影響力の大きいユーザを発見。
通常のPageRankやHITSでは、フォロワー数の多いユーザのスコアが高くなる傾向があるが、枝に重みを持たせることで、フォロワー数は少ないが影響力の大きいユーザを発見できることを示した。


-その他, 論文紹介

関連記事

Regularization of Latent Variable Models to Obtain Sparsity

Ramnath Balasubramanyan, William W. Cohen In Proc. of SDM 2013 概要 LDAのようなトピックモデルでは、単語が所属するトピックの分布や、文 …

Unsupervised Semantic Similarity Computation between Terms Using Web Documents

Elias Iosif Alexandros Potamianos In IEEE Transactions on Knowledge and Data Engineering, Vol.22, Nu …

Using information scent and need for cognition to understand online search behavior

Wu, Wan-Ching Kelly, Diane Sud, Avneesh In Proc. of SIGIR2014 http://dl.acm.org/citation.cfm?id=2609 …

Answering relationship queries on the web

Luo, Gang Tang, Chunqiang Tian, Ying-li In Proc. of WWW 2007 http://dl.acm.org/citation.cfm?id=12426 …

Web Object Retrieval

Nie, Zaiqing Ma, Yunxiao Shi, Shuming Wen, Ji-Rong Ma, Wei-Ying In Proc. of WWW 2007 http://dl.acm.o …