投稿日: SIGIR 論文紹介

【論文紹介】How Much Novelty is Relevant?: It Depends on Your Curiosity

Zhao, Pengfei and Lee, Dik Lun
In Proc. of SIGIR 2016

概要

心理学の分野では、対象物の刺激が強すぎても弱すぎても人は惹き付けられず、中程度のとき最も魅力を感じることが知られている。音楽の消費に例えると、普段モーツァルトを頻繁に聴いている人にモーツァルトの音楽を推薦しても刺激が弱く惹き付けられないし、かと言って全く雰囲気の異なるロックの音楽を推薦しても刺激が強すぎて惹き付けられず、クラシックだけれど普段聞かない曲を推薦すると刺激が中程度で最も魅力的に感じる、というものである。つまり、横軸を対象物の刺激、縦軸を対象物に対する人の興味とすると、山型の曲線を描く。このような曲線を心理学の分野でWundt曲線と呼ぶ。この論文では、Wundt曲線を利用し、対象物の刺激=推薦アイテムのnovelty、として適切なnovelty度合いのアイテムをユーザに推薦することを目的としている。

手法

まずは、時刻tにおけるユーザuにとってのアイテムiのnovelty度、つまり横軸の値を決める。横軸の値は、以下の3つの各観点からスコアを出し、その平均値とする。

  • 過去に同じアイテムにどれだけ頻繁に触れたか
  • 同じアイテムにどれだけ最近触れたか
  • 過去に類似アイテムにどれだけ頻繁に、どれだけ最近触れたか

次に、あるnovelty度を持つアイテムに対するユーザの興味の度合い、つまり縦軸の値を決める。時刻tまでにuが触れた全てのアイテムのnovelty度の分布からヒストグラムを作り、それをベータ分布で近似する。対象アイテムのnovelty度に対応する、ベータ分布の確率密度関数の値をユーザの興味の度合いとする。

この論文ではk個のアイテムを推薦する問題を扱う。ユーザuの時刻tまでのアイテムの消費履歴が入力として与えられると、アイテム数次元のベクトルのうちk個の要素のみが1で、残りの要素が0であるベクトルを出力する。つまり、推薦されるk個のアイテムの間に推薦スコアの大小はない。
通常のユーザ・アイテム行列の行列分解で得られる、アイテムに対するユーザの適合度と、アイテムに対するユーザのnoveltyベースの興味の度合いの線形和をとり、この値が最大になるようなベクトルを求める。

評価実験

Last.fmの音楽再生ログを利用。トレーニングデータを使ってユーザごとにWundt曲線を近似したベータ分布を求めたうえで曲を推薦し、テストデータ内でユーザが聴いた音楽との重複率を調べる。Noveltyを考慮しない通常の推薦手法よりも精度が高いことを確認した。


-SIGIR, 論文紹介

関連記事

Towards Better Measurement of Attention and Satisfaction in Mobile Search

Lagun, Dmitry Hsieh, Chih-Hung Webster, Dale Navalpakkam, Vidhya In Proc. of SIGIR2014 http://dl.acm …

Topic-Driven Reader Comments Summarization

Ma, Zongyang and Sun, Aixin and Yuan, Quan and Cong, Gao In Proc. of CIKM 2012 概要 ニュース記事のコメントをトピックごと …

Optimizing Search by Showing Results In Context

Dumais, Susan Cutrell, Edward Chen, Hao In Proc. of CHI2001 http://dl.acm.org/citation.cfm?id=365116 …

Efficiently answering top-k typicality queries on large databases

Hua, Ming Pei, Jian Fu, Ada W. C. Lin, Xuemin Leung, Ho-Fung In Proc. of VLDB 2007 http://dl.acm.org …

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew Dominowska, Ewa Ragno, Robert In Proc. of WWW2007 概要 検索結果の横に表示される広告のCTRの推定を目的として …