投稿日: CIKM 論文紹介

Collective intelligence in the online social network of yahoo!answers and its implications

Li, Ze
Shen, Haiying
Grant, Joseph Edward
In Proc. of CIKM 2012
http://dl.acm.org/citation.cfm?id=2396821

概要

Yahoo!Answers上では,一般的なSNSと同様にユーザ間でフォローを行う機能がある.一般的には,各ユーザは自分の興味のあるトピックについて質の高い回答をするユーザをフォロー(contact)し,質の高い回答を多くするユーザは多くのユーザからフォロー(fan)される.
この論文では,そのようにして形成されるYahoo!Answers上でのネットワークを用いた分析を行う.

データ

2011年8月17日から10月19日までの間に約12万人のユーザのデータを収集.その内の8%はtop contributerと呼ばれる,質の高い回答を多くするユーザであった.

ネットワークの全体的な性質

これ以降,ユーザがフォローしているユーザ集合をoutdegree,ユーザがフォローされているユーザ集合をindegreeと呼ぶ.

  • 相互フォローの割合
  • 相互フォローの割合は30.7%であり,他のSNSと比べて低い.16.7%のユーザはフォローだけして誰からもフォローされていない.

  • outdegree,indegreeの数
  • outdegreeの場合,Yahoo!answerwではユーザあたらいのフォロー数が200までと制限があるが,基本的には冪乗則に従い,一部のユーザが限界の200人までフォローしている.
    indegreeの場合はフォローされるユーザ数に制限はないので,きれいに冪乗則に従い,ごく一部のユーザが多数のユーザからフォローされている.

  • ユーザごとのoutdegree,indegreeの数
  • 一般的なSNSでは,フォロー数の多いユーザはフォロワー数も多いが,Yahoo!Answersではindegreeの多いユーザとoutdegreeの多いユーザが大きく異なる.これは,indegreeの多いユーザは知識が豊富なユーザであるため他者をフォローする必要はなく,outdegreeの多いユーザは知識がなく他者の回答に頼るため他者からフォローされることが少ないためである.

  • 1人のユーザがフォローしているユーザ間のつながり
  • あるユーザがN人のユーザをフォローしている場合に,そのN人の間でフォロー関係がどの程度成り立っているかを調べたところ,平均の割合は0.029で,一般的なSNSよりかなり低い値であった.Nの値が小さい場合,全員が同じカテゴリ内のユーザであることが多いため,割合は高くなり,Nが大きくなると,様々なカテゴリのユーザが含まれるので,割合は低くなる.

回答に関する分析

  • ユーザの振る舞い
  • 質の高い回答の大部分は,約10%のユーザによって投稿されたもの.回答数の多いユーザは,ベストアンサーに選ばれた回答の数も多い.23.1%のユーザはほぼ回答だけをし,13.6%のユーザはほぼ質問だけをする.

  • 回答者の専門カテゴリ
  • ユーザのプロファイルには,そのユーザのcontributionが高いカテゴリが記載されている.contributionの高いユーザの専門カテゴリを調べたところ,全部で26あるカテゴリのうち,12のカテゴリが全体の80%を占めた.
    contributionの高いユーザのうち,半数以上は2つ以上のgeneralカテゴリ(「スポーツ」等)を持ち,大部分は2つ以上のdetailedカテゴリ(「サッカー」等)を持つ.

  • 回答者とoutdegree,indegreeの関係
  • contributionの高いユーザは必ずしもoutdegreeの数は多くないが,indegreeの数は多い.


-CIKM, 論文紹介

関連記事

On a Topic Model for Sentences

Balikas, Georgios and Amini, Massih-Reza and Clausel, Marianne In Proc. of SIGIR 2016 概要 通常のLDAでは文書ご …

Lessons from the Journey: A Query Log Analysis of Within-Session Learning

Carsten Eickhoff Jaime Teevan Ryen White Susan T. Dumais In Proc. of WSDM 2014 概要 ユーザの検索トピックに対する専門度は …

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff Efthimiadis, Efthimis N. In Proc. of CIKM2009 http://dl.acm.org/citation.cfm?id=1645966 …

Understanding the importance of location, time, and people in mobile local search behavior

Teevan, Jaime Karlson, Amy Amini, Shahriyar Brush, A. J. Bernheim Krumm, John In Proc. of MobileHCI …

Spatio-temporal Dynamics of Online Memes: A Study of Geo-tagged Tweets

Kamath, Krishna Y. Caverlee, James Lee, Kyumin Cheng, Zhiyuan In Proc. of WWW 2013 http://dl.acm.org …