投稿日: その他 論文紹介

Modeling User Interest and Community Interest in Microbloggings: An Integrated Approach

Tuan-Anh Hoang
In Proc. of PAKDD 2015

概要

ツイッターユーザの興味と所属するコミュニティを、ユーザのツイート内容と振る舞い(リツイート、メンション、ハッシュタグの使用)から推定することを目的とした論文。

先行研究との違い

ツイート内容と振る舞いの両方を同時に考慮してユーザの興味とコミュニティをモデル化した研究は初めて。
また、政治コミュニティに属しているユーザであってもエンタメに興味を持つこともあるため、個人の興味とコミュニティの興味を分けて扱っている点も特徴である。

手法

トピックモデルを使用。ユーザはひとつのコミュニティにのみ属すると仮定している。ユーザごとに、ユーザのツイート内の単語やツイッター上での振る舞いが、ユーザ個人の興味とコミュニティの興味のどちらにどの程度影響を受けて生成されるかを表すベルヌーイ分布を持つ(例:ユーザAは個人の興味の影響度0.3、コミュニティの興味の影響度0.7)。

一部のユーザのコミュニティを人手でラベル付けして、それを教師データに使用することで、半教師ありトピックモデルに拡張。

さらに、既存研究(論文紹介はこちら)の手法を使うことで、特定のコミュニティでのみ生起確率が高くなるような質の高いトピックを抽出しやすくしている。これは、「グルメ」のような、どのコミュニティでもそこそこ生起確率が高くなるようなトピックの抽出を防ぐことを目的としている。

評価

ツイッターでsoftware engineeringに興味のある約1.5万ユーザを収集。うち3023ユーザにはdeveloperコミュニティかmarketerコミュニティのいずれに属するかを人手でラベル付け。つまりコミュニティ数は2。このデータを教師データおよび、ユーザの所属するコミュニティ推定結果の評価に使用。

評価には他にも、テストデータで計算されるperplexityを用いた定量的評価や、各コミュニティで生起確率の高いトピックの定性的評価を行っている。


-その他, 論文紹介

関連記事

Spatio-Temporal Topic Modeling in Mobile Social Media for Location Recommendation

Bo, Hu and Mohsen, Jamali and Martin, Ester In Proc. of ICDM 2013 概要 チェックインサービス等でのユーザと場所と時刻を考慮したモデル化 …

Struggling or Exploring? Disambiguating Search Sessions

Ahmed Hassan Ryen W. White Susan Dumais Yi-Min Wang In Proc. of WSDM2014 概要 長い検索セッションには,ユーザが情報の探索をして …

Sentiment-Based Topic Suggestion for Micro-Reviews

Ziyu Lu, Nikos Mamoulis, Evaggelia Pitoura, Panayiotis Tsaparas In Proc. of ICWSM 2016 概要 Foursquare …

User see, user point: gaze and cursor alignment in web search

Huang, Jeff White, Ryen Buscher, Georg In Proc. of CHI 2012 http://dl.acm.org/citation.cfm?id=220859 …

【論文紹介】The automated acquisition of suggestions from tweets

Dong, Li and Wei, Furu and Duan, Yajuan and Liu, Xiaohua and Zhou, Ming and Xu, Ke AAAI 2013 ACM, PD …