投稿日: SIGIR 論文紹介

Fusion Helps Diversification

Liang, Shangsong and Ren, Zhaochun and de Rijke, Maarten
In Proc. of SIGIR 2014

概要

検索結果を多様化する際に、複数の検索結果を統合することで、より良い多様化検索結果を生成することを目的とした論文。

先行研究との違い

多様化結果を生成するために複数の検索結果を統合したのはこの研究が初。また、多様化の研究では一般的に、「京都」というクエリに対して「観光」や「歴史」などのサブトピックを明示的に扱うが、この論文ではトピックモデルのトピックという抽象度が一段高い情報を使って多様化をしている。

手法

以下の3ステップから成る。

  1. 検索結果統合
  2. クエリに対して、何種類かのアルゴリズムによって生成された複数の検索結果がある場合に、CombSUMなどの既存手法を使ってひとつの新しい検索結果に統合する。

  3. トピック推定
  4. ステップ1の統合に使用した全文書を使って、LDAベースのトピックモデルを使用してクエリに関するトピックを抽出。

  5. 多様化
  6. PM-2という既存の多様化手法を使って、ステップ2で得られたトピックを元にステップ1で生成した検索結果を多様化。

評価

TREC2009から2012の多様化タスクのデータを使用。各年に提出された多様化結果のうち、上位5つの結果を統合に使う。つまり、既に多様化された検索結果をステップ1で統合し、その後さらにステップ3で多様化していることになる。
単に統合するだけでも、統合前の多様化結果よりも精度が高くなり、統合結果を多様化することでさらに精度が高くなることを示した。


-SIGIR, 論文紹介

関連記事

Addressing people’s information needs directly in a web search result page

Chilton, Lydia B. Teevan, Jaime In Proc. of WWW 2011 http://dl.acm.org/citation.cfm?id=1963413 概要 最近 …

Spatial influence vs. community influence: modeling the global spread of social media

Kamath, Krishna Y. Caverlee, James Cheng, Zhiyuan Sui, Daniel Z. In Proc. of CIKM 2012 http://dl.acm …

Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs

Brody, Samuel Diakopoulos, Nicholas In Proc. of EMNLP2011 http://dl.acm.org/citation.cfm?id=2145498 …

Placing Videos on a Semantic Hierarchy for Search Result Navigation

Tan, Song Jiang, Yu-Gang Ngo, Chong-Wah ACM TOMM 2014 http://dl.acm.org/citation.cfm?id=2578394 概要 「 …

Perception and understanding of social annotations in web search

Fernquist, Jennifer Chi, Ed H. In Proc. of WWW 2013 http://dl.acm.org/citation.cfm?id=2488424 概要 Goo …