投稿日: WSDM 論文紹介

Lessons from the Journey: A Query Log Analysis of Within-Session Learning

Carsten Eickhoff
Jaime Teevan
Ryen White
Susan T. Dumais
In Proc. of WSDM 2014

概要

ユーザの検索トピックに対する専門度は,検索セッション中やセッション間でも変化すると考えられる.この論文では,ユーザの検索時の振る舞いや検索結果のデータとユーザの専門度の関係を分析している.

データセット

ユーザがある知識を獲得するうえでの専門度の分析を行うために,知識獲得を目的としたセッションをクエリログから収集.知識獲得を目的とした検索には「how to do」を調べるものと「about」を調べるものがある.前者に関する検索を集めるために最後のクリックがhttp://ehow.comドメインで終わっているセッションを集め,後者に関する検索を集めるために最後のクリックがhttp://wikipedia.orgドメインで終わっているセッションを集める.さらにそれらの中で「how」等の語を持つクエリが含まれていれば前者の検索セッション(D_{proc}),「what」等の語を持つクエリが含まれていれば後者の検索セッション(D_{decl}),それ以外をその他のセッション(D_{other})に分類.

専門度と1セッション内の指標の関係

5クエリから成るセッションを対象として,クエリごとにクエリの複雑さや検索結果中のトピック数などいくつかの指標を計算し,D_{proc}D_{decl}D_{other}の間で比較.
結果,D_{proc}D_{decl}ではD_{other}に比べて,クエリを発行するごとに

  • 検索結果中のユニークなドメインの数が増える,
  • 検索結果中のトピック数が少なくなる,
  • クエリの複雑さが増加する,

等の違いが見られた.

検索結果のクリックが専門度に与える影響

ユーザが検索結果をクリックしてページを閲覧した場合,それにより何らかの知識を得るので専門度は高くなり,次の検索に影響を与えると考えられる.そこで,検索結果をクリックせずに新しいクエリを入力した場合と検索結果をクリックした後に新しいクエリを入力した場合のいくつかの指標の違いをD_{proc}D_{decl}D_{other}それぞれで比較.
結果,D_{proc}D_{decl}D_{other}に共通して見られた傾向として,クリックをした場合はクリックをしなかった場合に比べて

  • 検索結果中のトピックが増加する,
  • 検索結果中のユニークなドメインの数が増加する,
  • クエリの複雑さが増加する,

等があげられる.ただし,この傾向はD_{other}に比べてD_{proc}D_{decl}の方が顕著であった.


-WSDM, 論文紹介
-

関連記事

Exploring and exploiting user search behavior on mobile and tablet devices to improve search relevance

Song, Yang Ma, Hao Wang, Hongning Wang, Kuansan In Proc. of WWW 2013 http://dl.acm.org/citation.cfm? …

Supporting Complex Search Tasks

Ahmed Hassan Awadallah Ryen W. White Patrick Pantel Susan T. Dumais Yi-Min Wang In Proc. of CIKM2014 …

Modeling Paying Behavior in Game Social Networks

Fang, Zhanpeng and Zhou, Xinyu and Tang, Jie and Shao, Wei and Fong, A.C.M. and Sun, Longjun and Din …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Retrieval models for question and answer archives

Xue, Xiaobing Jeon, Jiwoon Croft, W. Bruce In Proc. of SIGIR 2008 http://dl.acm.org/citation.cfm?id= …