投稿日:2014/11/08 更新日: CIKM 論文紹介

Tagging Your Tweets: A Probabilistic Modeling of Hashtag Annotation in Twitter

Ma, Zongyang
Sun, Aixin
Yuan, Quan
Cong, Gao
In Proc. of CIKM2014
http://dl.acm.org/citation.cfm?id=2661903

概要

ハッシュタグ付きのツイートのモデル化を目的とした論文。ユーザ、時間、ツイート内容、ハッシュタグを考慮したトピックモデルを提案している。
提案モデルを用いて、あるツイートに対するハッシュタグの推薦および、あるハッシュタグと関連のあるハッシュタグの発見を行っている。

モデル

以下の2種類のモデルを提案。いずれもユーザ、時間、ツイート内容、ハッシュタグを考慮している。

  • Content-Pivoted Model(CPM)
  • このモデルでは、ユーザはまずツイート内容を記述してから、その内容を表すのに適切なハッシュタグを考える、と仮定している。つまり、ユーザと時間に応じてトピックが生成され、トピックに応じてツイート内の単語とハッシュタグが生成される。
    ツイートdとトピックzの同時確率は以下のように表される。
     p(d,z)=p(u)p(t)p(z|u,t)p(\bm{w}_{d}|z)p(\bm{h}_{d}|z)
    uはユーザ、tは日付け、\bm{w}_{d}はツイート内の単語、\bm{h}_{d}はツイート内のハッシュタグを表す。また、p(z|u,t)=\alpha p(z|u) + (1-\alpha )p(z|t)

  • Hashtag-Pivoted Model(HPM)
  • このモデルでは、ユーザは事前に選択したハッシュタグに応じてツイート内容を記述する、と仮定している。つまり、ユーザ、時間、ハッシュタグに応じてトピックが生成され、トピックに応じてツイート内の単語が生成される。
    ツイートdとトピックzの同時確率は以下のように表される。
     p(d,z)=p(u)p(t)p(\bm{h}_{d})p(z|u,t,\bm{h}_{d})p(\bm{w}_{d}|z)

いずれのモデルでも、パラメータをEMアルゴリズムで推定。

さらに、上記の各モデルに対して、「メンションを飛ばし合うユーザ同士は似たトピックを共有する」という仮定を組み込んだCPM-sn、HPM-snの2つのモデルも提案。

実験

ツイート集合を学習用とテスト用に分け、テストデータのperplexityを各モデルで計算。実験の結果、CPMよりもHPMの方が、HPMよりもHPM-snの方が良い結果を得た。

上記の実験に加えて、ツイートdが与えられたときに、dに対して付与すべきハッシュタグの推薦精度の実験および、ハッシュタグhが与えられたときに、全ハッシュタグをhと関連度の高い順にランキングする精度の実験を行っている。


-CIKM, 論文紹介

関連記事

【論文紹介】Content-boosted matrix factorization for recommender systems: experiments with recipe recommendation

Forbes, Peter and Zhu, Mu RecSys 2011 ACM, PDF 概要 ユーザのアイテムに対するレーティングを予測する際に、アイテムの構成要素を考慮した、Matrix Fa …

Modeling User Interest and Community Interest in Microbloggings: An Integrated Approach

Tuan-Anh Hoang In Proc. of PAKDD 2015 概要 ツイッターユーザの興味と所属するコミュニティを、ユーザのツイート内容と振る舞い(リツイート、メンション、ハッシュタグの …

Crowdsourcing for relevance evaluation

Alonso, Omar Rose, Daniel E. Stewart, Benjamin In SIGIR Forum, Vol.42, Num.2 http://dl.acm.org/citat …

Experiments with a Venue-Centric Model for Personalisedand Time-Aware Venue Suggestion

Deveaud, Romain and Albakour, M-Dyaa and Macdonald, Craig and Ounis, Iadh In Proc. of CIKM 2015 概要 ユ …

【論文紹介】Bartering Books to Beers: A Recommender System for Exchange Platforms

Rappaz, Jérémie and Vladarean, Maria-Luiza and McAuley, Julian and Catasta, Michele WSDM 2017 ACM, P …