投稿日: SIGIR 論文紹介

Using preference judgments for novel document retrieval

Chandar, Praveen
Carterette, Ben
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348398

概要

検索結果の多様化に関する研究でこれまで前提とされていた,「新しいサブトピックを含み,既に選ばれた文書とサブトピックの重複がない文書が好ましい」という考えが本当に正しいのかを検証することを目的としている.

検証方法

あるトピックに関する文書を評価者に1つ見せ,その下に2つの文書を並べて見せたときに,どちらがより好まれるかをもとに検証を行う.より具体的には,以下の3点について検証を行う.
ただし,D_{T}は最初に見せる文書で,D_{L}D_{R}はそれぞれD_{T}の下に表示される左の文書と右の文書を表す.また,S_{i}はサブトピックを表す.

・仮説1
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2}\},\{S_{1}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(重複よりも新規性の方が好まれる.)

・仮説2
 もし<D_{L},D_{R}|D_{T}> = <\{S_{1},S_{2}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性のみよりも新規性+重複の方が好まれる.)

・仮説3
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2},S_{3}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性が1つだけよりも,新規性が2つある方が好まれる.)

各仮説に対して6つのトピックを用意し,さらに各トピックに対してD_{T}D_{L}D_{R}の組を4つずつ用意する.
評価にはAmazon Mechanical Turkを利用し,1つの組を5人が評価する.

結果

仮説1に関しては,新規性の方が好まれるであろうという予想に反して,差はなかった.仮説2と3については,予想通りの結果で,新規性のみよりも新規性+重複の方が好まれ,新規性が1つだけよりも新規性が2つある方が好まれる,という結果になった.


-SIGIR, 論文紹介
-

関連記事

Where you Instagram?: Associating Your Instagram Photos with Points of Interest

Li, Xutao and Pham, Tuan-Anh Nguyen and Cong, Gao and Yuan, Quan and Li, Xiao-Li and Krishnaswamy, S …

Tagging Your Tweets: A Probabilistic Modeling of Hashtag Annotation in Twitter

Ma, Zongyang Sun, Aixin Yuan, Quan Cong, Gao In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id= …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …

User see, user point: gaze and cursor alignment in web search

Huang, Jeff White, Ryen Buscher, Georg In Proc. of CHI 2012 http://dl.acm.org/citation.cfm?id=220859 …

A music recommendation system based on annotations about listeners’ preferences and situations

Kaji, K. Hirata, K. Nagao, K. In Proc. of AXMEDIS 2005 http://ieeexplore.ieee.org/xpl/login.jsp?tp=& …