投稿日: その他 論文紹介

Sentiment-Based Topic Suggestion for Micro-Reviews

Ziyu Lu, Nikos Mamoulis, Evaggelia Pitoura, Panayiotis Tsaparas
In Proc. of ICWSM 2016

概要

Foursquareのように、ユーザがスポットに対してコメントを投稿できる位置情報サービスを対象にしている。全ユーザが様々なスポットに投稿したコメントに対してトピックモデルに基づく手法を用いることで、ユーザが初めて訪れるスポットで興味を持つであろうトピックを推定する。これにより、たとえばあるユーザがあるレストランに初めて行ったとき、そのユーザが「サービスの質」というトピックを重視していることをレストランのマネージャが把握できれば、サービスを重視して対応する、といったことが可能になる。

先行研究との違い

類似研究として、長文のレビューが投稿できるサービスを対象にして、ユーザのスポットに対するレーティングを予測する研究があげられる。それらの研究でもトピックモデルを用いているが、位置情報サービスのコメントは短いため、既存研究と同じようにトピックモデルを適用するのは難しい。また、位置情報サービスを対象にトピックを推定するという問題に着目した研究は過去に行われていない。

手法

コメントの短さを補うために、ひとつのスポットに投稿された全ユーザのコメントをまとめてひとつの文書のようにみなす。
モデル化の際は単語のセンチメントも考慮している。単語のセンチメント(positive、negative、neutral)は辞書を用いて判定しており、観測可能な情報として扱われている。
トピック分布は各スポットと各センチメントに対して存在し、ユーザごとにセンチメント分布が存在する。
生成モデルの中ではまず、author topicモデルのように、単語ごとにそのスポットに投稿した全ユーザから一人をランダムに選択する。ユーザごとに「場所の影響でトピックを決定する確率」と「ユーザの興味でトピックを決定する確率」をベルヌーイ分布として持っていて、前者が選ばれればそのスポットのトピック分布からトピックを生成する。後者であればそのユーザのセンチメントからセンチメントを生成し、そのセンチメントのトピック分布からトピックを生成する。いずれの場合も、共通のトピック-単語分布を用いて単語を生成する。

評価

FoursquareとYelpを使用。それぞれから2つの都市を選択。ひとつの都市のスポット数は5,000~10,000程度。評価指標にはperplexityを使用。ユーザとスポットのペアに対して推薦されるトピックの評価は、手法ごとに推薦されるトピックを比較する定性的な評価を行っている。


-その他, 論文紹介

関連記事

Finding Dimensions for Queries

Z. Dou, S. Hu, Y. Luo, R. Song, and JR. Wen In Proc. of CIKM2011 http://dl.acm.org/citation.cfm?id=2 …

Bad News Travel Fast: A Content-based Analysis of Interestingness on Twitter

Nasir Naveed Thomas Gottron Jérôme Kunegis Arifah Che Alhadi In Proc. of WebSci 2011 http://dl.acm.o …

Time-critical search

Mishra, Nina and White, Ryen W. and Ieong, Samuel and Horvitz, Eric In Proc. of SIGIR 2014 概要 一緒にいる人 …

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi Agichtein, Eugene In Proc. of SIGIR 2010 http://dl.acm.org/citation.cfm?id=1835473 概要 ユーザの検索 …

【論文紹介】What Makes a Link Successful on Wikipedia?

Dimitrov, Dimitar and Singer, Philipp and Lemmerich, Florian and Strohmaier, Markus In Proc. of WWW …