投稿日: その他 論文紹介

Modelling User Interest for Zero-query Ranking

Liu Yang, Qi Guo, Yang Song, Sha Meng, Milad Shokouhi, Kieran McDonald, and W. Bruce Croft
In Proc. of ECIR 2016

概要

Google NowやMicrosoft Cortanaといった、ユーザの状況に応じてカードをランキングして表示するアプリにおいて、Learning to Rankを用いたカードのランキング精度の改善を目的とした論文。

特徴量

Learning to Rankに使用する特徴量は以下の3カテゴリ。

  1. Cart Type based Implicit Feedback Features: カードの種類(ニュースや、天気予報、フライト情報など)単位で決まる特徴量。Dwell timeが30秒以上のSATなクリックの割合や、クリックをせずにカードを見ている平均時間など。
  2. Entity based User Interests Features: ユーザのWeb閲覧履歴等から推定される、ユーザが興味を持つトピックと、カードのトピックの類似度で決まる特徴量。
  3. User Demographics Features: 各カードをクリックしたユーザの属性で決まる特徴量。カードをクリックしたユーザの平均年齢や男女比など。

評価方法

Microsoft Cortanaのデータを使用。トレーニングデータは2015/3/18~24の1週間、テストデータは2015/3/25~31の1週間を使用。
クリック後30秒以上のdwell timeを持つカードと、クリックはされなかったが10秒以上閲覧されたカードを適合カードとして、LambdaMARTを使用して求めたランキングのMRRとnDCG@1を評価。
実験の結果、上記3カテゴリすべての特徴量を使用した場合が最も精度が高く、各特徴量の有用度を評価したろころ、1つ目のカテゴリの有用度が特に高いことがわかった。


-その他, 論文紹介

関連記事

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor In Proc. of WWW 2012 http://dl.acm.org/citation.cfm?id …

Music on YouTube: User engagement with traditional, user-appropriated and derivative videos

Liikkanen, Lassi A. and Salovaara, Antti In Computers in Human Behavior, vol. 50 概要 YouTubeの音楽動画を対象に …

Re-Examining Search Result Snippet Examination Time for Relevance Estimation

Lagun, Dmitry Agichtein, Eugene In Proc. of SIGIR2012 http://dl.acm.org/citation.cfm?id=2348509 概要 従 …

Struggling or Exploring? Disambiguating Search Sessions

Ahmed Hassan Ryen W. White Susan Dumais Yi-Min Wang In Proc. of WSDM2014 概要 長い検索セッションには,ユーザが情報の探索をして …

From Skimming to Reading: A Two-stage Examination Model for Web Search

Liu, Yiqun Wang, Chao Zhou, Ke Nie, Jianyun Zhang, Min Ma, Shaoping In Proc. of CIKM 2014 http://dl. …