投稿日:2012/11/04 更新日: SIGIR 論文紹介

Personalized Diversification of Search Results

D. Vallet and P. Castells
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348396

目的

検索結果の多様化を行うときに,ユーザにとって重要なサブトピックを考慮した多様化を行う.例えば,「ハリーポッター」というクエリに対して一般的には「映画」というサブトピックが重要であっても,検索しているユーザにとって「本」というサブトピックが重要であれば,ハリーポッターの本に関するページを上位に提示する.

手法

多様化のアルゴリズムとしては,既存のIA-SelectとxQuADをベースとして使用し,それぞれを個々のユーザの好みを反映できるモデルに拡張する.
qをクエリ,cをサブトピック,dを文書としたときに,例えばIA-Selectでは,p(c|q)p(q|d)p(c|d)を計算する必要があるが,これにユーザuも考慮し,それぞれp(c|q,u)p(q|d,u)p(c|d,u)に拡張する.
例えばp(c|d,u)は以下のように計算する.
 p(c|d,u)=\frac{p(d|c,u)p(c|u)}{p(d|u)} \sim \frac{p(d|c)p(c|u)}{\sum_{c\prime}p(d|c\prime)p(c\prime|u)}
        =\frac{p(c|d)p(c|u)}{\sum_{c\prime}p(c\prime|d)p(c\prime|u)}=C_{2}(d,u)p(c|d)p(c|u).
C_{2}(d,u)は定数.このとき,サブトピックcが与えられた下で,文書dはユーザuに対して条件付き独立であると仮定し,p(d|c,u)=p(d|c)としている.
さらに,p(c|u)を以下のように変形する.
 p(c|u)=\sum_{d}p(c|d,u)p(d|u) \sim \sum_{d}p(c|d)p(d|u).
ここでも,文書dが与えられた下で,サブトピックcはユーザuに対して条件付き独立であると仮定し,p(c|d,u)=p(c|d)としている.これにより,ユーザに依存する部分はp(d|u)だけになる.p(d|u)は,ユーザuがどの程度文書dを気に入るか,を表す.
p(q|d,u)p(c|q,u)についても,同様に条件付き独立を仮定してp(d|u)を計算すれば良くなるように変形する.
p(d|u)を計算するために2つの手法を提案している.1つ目は,文書を単語wにまで分解し,p(w|u)を計算する.p(w|u)を求める方法としては,ユーザがDeliciousでブックマークしているページ集合内での単語wのTF値を用いている.2つ目は,同じく単語のTF値を用いてBM25と同様に文書のスコアを求める.

実験

評価にはクラウドソーシングを利用.被験者には,文書がどの程度自分にとって興味があるか,クエリとどの程度関連があるか,文書のサブトピック,の3つを聞いている.
実験の結果,xQuADを個人用に拡張し,かつp(d|u)をBM25に基づいて計算する手法が最も良かった.


-SIGIR, 論文紹介
-,

関連記事

【論文紹介】Generative Feature Language Models for Mining Implicit Features from Customer Reviews

Karmaker Santu, Shubhra Kanti and Sondhi, Parikshit and Zhai, ChengXiang CIKM 2016 ACM 概要 イリノイ大学のChe …

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco RecSys 2011 ACM, PDF 概要 コンテキストによるバイアスを考慮したレー …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

Modeling User Posting Behavior on Social Media

Xu, Zhiheng Zhang, Yang Wu, Yao Yang, Qing In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id= …

Can social features help learning to rank youtube videos?

Chelaru, Sergiu Viorel Orellana-Rodriguez, Claudia Altingovde, Ismail Sengor In Proc. of WISE 2012 概 …