投稿日: WSDM 論文紹介

Efficient multiple-click models in web search

Guo, Fan
Liu, Chao
Wang, Yi Min
In Proc. of WSDM2009

概要

クリックモデルに関するこれまでの研究では、ユーザはクエリを入力して1度検索結果をクリックしたら検索を終えるというモデルであったが、この論文ではクエリを入力して複数回検索結果をクリックするモデルを提案している。提案モデルはindependent click model(ICM)とdependent click model(DCM)の2つ。

クリックモデルの精度検証方法

ユーザuが入力したクエリqと、qに対する上位10件の検索結果と、各検索結果をuがクリックしたか否かのデータが与えられる。クリックモデルでは、あるユーザの検索行動をいかに忠実にシミュレートできるかを検証することが目的であり、あるユーザのある検索行動が起きる確率を計算している。ユーザの行動データを複数のモデルに与えたときに、最も高い確率を計算したモデルが最も良いモデルと言える。

ICM

ユーザが1回だけ検索結果をクリックすることを想定したcascade modelと呼ばれる既存のモデルを複数回クリックに拡張したもの。クエリqを入力したユーザはi番目の文書d_{i}を確率r_{d_{i}}でクリックするという行動を1位から10位まで繰り返す。d_{i}より上位の文書をクリックしたかどうかはd_{i}をクリックするかどうかに影響しないので「independent」なモデル。r_{d_{i}}qに関する検索ログ中で、d_{i}がクリックされた回数/d_{i}が表示された回数によって求める。

DCM

d_{i}を確率r_{d_{i}}でクリックしたユーザは、確率\lambda_{i}d_{i+1}に進み、1-\lambda_{i}の確率で検索を止めるというモデル。d_{i}より上位の文書をクリックしたかどうかがd_{i}をクリックするかどうかに影響するので「dependent」なモデル。\lambda_{i}は以下で求める。
1-\frac{\sharp\:{\rm query\:sessions\:when\:last\:clicked\:position}=i}{\sharp\:{\rm query\:sessions\:when\:position}\:i\:{\rm is\:clicked}}

実験

Bingの検索ログから約11万件のクエリに対する約400万セッションを取得して訓練データとテストデータに分類。訓練データを用いてr_{d_{i}}\lambda_{i}を求める。
実験の結果、入力される頻度が高いクエリに対してはDCMの方が良い結果であった。また、First Clickの推定精度に関しては2つのモデル間で大きな差は無かったが、Last Clickの推定精度はDCMの方がICMよりも高かった。


-WSDM, 論文紹介

関連記事

Understanding the importance of location, time, and people in mobile local search behavior

Teevan, Jaime Karlson, Amy Amini, Shahriyar Brush, A. J. Bernheim Krumm, John In Proc. of MobileHCI …

Efficiently answering top-k typicality queries on large databases

Hua, Ming Pei, Jian Fu, Ada W. C. Lin, Xuemin Leung, Ho-Fung In Proc. of VLDB 2007 http://dl.acm.org …

Using information scent and need for cognition to understand online search behavior

Wu, Wan-Ching Kelly, Diane Sud, Avneesh In Proc. of SIGIR2014 http://dl.acm.org/citation.cfm?id=2609 …

Music on YouTube: User engagement with traditional, user-appropriated and derivative videos

Liikkanen, Lassi A. and Salovaara, Antti In Computers in Human Behavior, vol. 50 概要 YouTubeの音楽動画を対象に …

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff Efthimiadis, Efthimis N. In Proc. of CIKM2009 http://dl.acm.org/citation.cfm?id=1645966 …