投稿日: その他 論文紹介

VODUM: A Topic Model Unifying Viewpoint, Topic and Opinion Discovery

Thibaut, Thonet and Guillaume, Cabanac and Mohand, Boughanem and Karen, Pinel-Sauvagnat
In Proc. of ECIR 2016

概要

文書が与えられたときに、文書のviewpoint、文書で触れられているtopic集合、各topicで述べられているopinion集合を求めることを目的とした論文。
語の意味は以下のとおり(論文から引用)。

  • topic: one of the subjects discussed in a document collection.
  • viewpoint: the standpoint of one or several authors on a set of topics.
  • opinion: a wording that is specific to a topic and a viewpoint.

先行研究との違い

以下の4点すべてを同時に考慮した点が新しい。

  • 教師なしのモデル。
  • topicに関する単語(名詞)とopinionに関する単語(動詞、形容詞、形容動詞)を別々に扱う。
  • viewpointが文書レベルで割り当てられる。
  • スレッド情報やユーザ間のインタラクション情報などは必要なく、プレーンテキストの集合を扱える。

文書の生成モデル

以下のような順で単語が記述される生成モデルを提案。

  1. 文書の著者がviewpointを1つ決める。
  2. 文ごとにtopicを1つ決める。
  3. viewpointとtopicの組み合わせに応じて、topicを記述する単語とopinionを記述する単語を決めて文を記述する。

評価方法

使用するデータセットは、Bitterlemonsと呼ばれるサービス上でイスラエル人とパレスチナ人によって記述された297本ずつのエッセイ。したがって、このデータセットではviewpointの数は2となる。
評価では、10-fold cross-validationを行った際のperplexityをベースライン手法と比較している。
また、viewpointの正解データは各文書がイスラエル人かパレスチナ人のどちらによって記述されたかという正解データがあるため、文書ごとに推定されるviewpointの推定精度の評価も行った。


-その他, 論文紹介

関連記事

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco RecSys 2011 ACM, PDF 概要 コンテキストによるバイアスを考慮したレー …

Improving passage ranking with user behavior information

Weize Kong Elif Aktolga James Allan In Proc. of CIKM 2013 概要 検索中のユーザの振る舞いを基に検索結果をリランキングする研究はこれまでにも行わ …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

A music recommendation system based on annotations about listeners’ preferences and situations

Kaji, K. Hirata, K. Nagao, K. In Proc. of AXMEDIS 2005 http://ieeexplore.ieee.org/xpl/login.jsp?tp=& …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …