投稿日: SIGIR 論文紹介

Using preference judgments for novel document retrieval

Chandar, Praveen
Carterette, Ben
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348398

概要

検索結果の多様化に関する研究でこれまで前提とされていた,「新しいサブトピックを含み,既に選ばれた文書とサブトピックの重複がない文書が好ましい」という考えが本当に正しいのかを検証することを目的としている.

検証方法

あるトピックに関する文書を評価者に1つ見せ,その下に2つの文書を並べて見せたときに,どちらがより好まれるかをもとに検証を行う.より具体的には,以下の3点について検証を行う.
ただし,D_{T}は最初に見せる文書で,D_{L}D_{R}はそれぞれD_{T}の下に表示される左の文書と右の文書を表す.また,S_{i}はサブトピックを表す.

・仮説1
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2}\},\{S_{1}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(重複よりも新規性の方が好まれる.)

・仮説2
 もし<D_{L},D_{R}|D_{T}> = <\{S_{1},S_{2}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性のみよりも新規性+重複の方が好まれる.)

・仮説3
 もし<D_{L},D_{R}|D_{T}> = <\{S_{2},S_{3}\},\{S_{2}\}|\{S_{1}\}>なら,D_{R}よりもD_{L}の方が好まれる.(新規性が1つだけよりも,新規性が2つある方が好まれる.)

各仮説に対して6つのトピックを用意し,さらに各トピックに対してD_{T}D_{L}D_{R}の組を4つずつ用意する.
評価にはAmazon Mechanical Turkを利用し,1つの組を5人が評価する.

結果

仮説1に関しては,新規性の方が好まれるであろうという予想に反して,差はなかった.仮説2と3については,予想通りの結果で,新規性のみよりも新規性+重複の方が好まれ,新規性が1つだけよりも新規性が2つある方が好まれる,という結果になった.


-SIGIR, 論文紹介
-

関連記事

Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction

Hu, Longke and Sun, Aixin and Liu, Yong In Proc. of SIGIR 2014 概要 店sの周辺の店の情報を利用することで、ユーザuのsに対するレーティン …

An Eye Tracking Study of the Effect of Target Rank on Web Search

Guan, Zhiwei Cutrell, Edward In Proc. of CHI2007 http://dl.acm.org/citation.cfm?id=1240691 概要 デスクトップ …

【論文紹介】Cats and Captions vs. User Characteristics and the Clock: A Time-Controlled Analysis of Multimodal Content

Hessel, Jack and Lee, Lillian and Mimno David In Proc. of WWW 2017 概要 Redditと呼ばれるソーシャルニュースサイトに投稿された画 …

Mining Query Subtopics from Search Log Data

Hu, Yunhua Qian, Yanan Li, Hang Jiang, Daxin Pei, Jian Zheng, Qinghua In Proc. of SIGIR 2012 http:// …

Everyday Life Music Information-Seeking Behaviour of Young Adults

Audrey Laplante J. Stephen Downie In Proc. of ISMIR 2006 概要 20人の若者を対象に、新しい音楽を探す際にとる行動についてインタビューを行い、結 …