投稿日: その他 論文紹介

VODUM: A Topic Model Unifying Viewpoint, Topic and Opinion Discovery

Thibaut, Thonet and Guillaume, Cabanac and Mohand, Boughanem and Karen, Pinel-Sauvagnat
In Proc. of ECIR 2016

概要

文書が与えられたときに、文書のviewpoint、文書で触れられているtopic集合、各topicで述べられているopinion集合を求めることを目的とした論文。
語の意味は以下のとおり(論文から引用)。

  • topic: one of the subjects discussed in a document collection.
  • viewpoint: the standpoint of one or several authors on a set of topics.
  • opinion: a wording that is specific to a topic and a viewpoint.

先行研究との違い

以下の4点すべてを同時に考慮した点が新しい。

  • 教師なしのモデル。
  • topicに関する単語(名詞)とopinionに関する単語(動詞、形容詞、形容動詞)を別々に扱う。
  • viewpointが文書レベルで割り当てられる。
  • スレッド情報やユーザ間のインタラクション情報などは必要なく、プレーンテキストの集合を扱える。

文書の生成モデル

以下のような順で単語が記述される生成モデルを提案。

  1. 文書の著者がviewpointを1つ決める。
  2. 文ごとにtopicを1つ決める。
  3. viewpointとtopicの組み合わせに応じて、topicを記述する単語とopinionを記述する単語を決めて文を記述する。

評価方法

使用するデータセットは、Bitterlemonsと呼ばれるサービス上でイスラエル人とパレスチナ人によって記述された297本ずつのエッセイ。したがって、このデータセットではviewpointの数は2となる。
評価では、10-fold cross-validationを行った際のperplexityをベースライン手法と比較している。
また、viewpointの正解データは各文書がイスラエル人かパレスチナ人のどちらによって記述されたかという正解データがあるため、文書ごとに推定されるviewpointの推定精度の評価も行った。


-その他, 論文紹介

関連記事

Everyday Life Music Information-Seeking Behaviour of Young Adults

Audrey Laplante J. Stephen Downie In Proc. of ISMIR 2006 概要 20人の若者を対象に、新しい音楽を探す際にとる行動についてインタビューを行い、結 …

Collective intelligence in the online social network of yahoo!answers and its implications

Li, Ze Shen, Haiying Grant, Joseph Edward In Proc. of CIKM 2012 http://dl.acm.org/citation.cfm?id=23 …

Unexpected Relevance: An Empirical Study of Serendipity in Retweets

Tao Sun Ming Zhang Qiaozhu Mei In Proc. of ICWSM 2013 概要 Serendipityな情報とはどのようなものかを定義した論文.また,その定義に基づい …

A New Semantic Similarity Measuring Method Based on Web Search Engines

Lu, Gang Huang, Peng He, Lijun Cu, Changyong Li, Xiaobo In W. Trans. on Comp. vol. 9 http://dl.acm.o …

Improving passage ranking with user behavior information

Weize Kong Elif Aktolga James Allan In Proc. of CIKM 2013 概要 検索中のユーザの振る舞いを基に検索結果をリランキングする研究はこれまでにも行わ …