投稿日: WSDM 論文紹介

Lessons from the Journey: A Query Log Analysis of Within-Session Learning

Carsten Eickhoff
Jaime Teevan
Ryen White
Susan T. Dumais
In Proc. of WSDM 2014

概要

ユーザの検索トピックに対する専門度は,検索セッション中やセッション間でも変化すると考えられる.この論文では,ユーザの検索時の振る舞いや検索結果のデータとユーザの専門度の関係を分析している.

データセット

ユーザがある知識を獲得するうえでの専門度の分析を行うために,知識獲得を目的としたセッションをクエリログから収集.知識獲得を目的とした検索には「how to do」を調べるものと「about」を調べるものがある.前者に関する検索を集めるために最後のクリックがhttp://ehow.comドメインで終わっているセッションを集め,後者に関する検索を集めるために最後のクリックがhttp://wikipedia.orgドメインで終わっているセッションを集める.さらにそれらの中で「how」等の語を持つクエリが含まれていれば前者の検索セッション(D_{proc}),「what」等の語を持つクエリが含まれていれば後者の検索セッション(D_{decl}),それ以外をその他のセッション(D_{other})に分類.

専門度と1セッション内の指標の関係

5クエリから成るセッションを対象として,クエリごとにクエリの複雑さや検索結果中のトピック数などいくつかの指標を計算し,D_{proc}D_{decl}D_{other}の間で比較.
結果,D_{proc}D_{decl}ではD_{other}に比べて,クエリを発行するごとに

  • 検索結果中のユニークなドメインの数が増える,
  • 検索結果中のトピック数が少なくなる,
  • クエリの複雑さが増加する,

等の違いが見られた.

検索結果のクリックが専門度に与える影響

ユーザが検索結果をクリックしてページを閲覧した場合,それにより何らかの知識を得るので専門度は高くなり,次の検索に影響を与えると考えられる.そこで,検索結果をクリックせずに新しいクエリを入力した場合と検索結果をクリックした後に新しいクエリを入力した場合のいくつかの指標の違いをD_{proc}D_{decl}D_{other}それぞれで比較.
結果,D_{proc}D_{decl}D_{other}に共通して見られた傾向として,クリックをした場合はクリックをしなかった場合に比べて

  • 検索結果中のトピックが増加する,
  • 検索結果中のユニークなドメインの数が増加する,
  • クエリの複雑さが増加する,

等があげられる.ただし,この傾向はD_{other}に比べてD_{proc}D_{decl}の方が顕著であった.


-WSDM, 論文紹介
-

関連記事

Using preference judgments for novel document retrieval

Chandar, Praveen Carterette, Ben In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348398 概要 …

Semantic Annotation of Mobility Data using Social Media

Wu, Fei and Li, Zhenhui and Lee, Wang-Chien and Wang, Hongjian and Huang, Zhuojie In Proc. of WWW 20 …

Time-critical search

Mishra, Nina and White, Ryen W. and Ieong, Samuel and Horvitz, Eric In Proc. of SIGIR 2014 概要 一緒にいる人 …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Spatio-temporal Dynamics of Online Memes: A Study of Geo-tagged Tweets

Kamath, Krishna Y. Caverlee, James Lee, Kyumin Cheng, Zhiyuan In Proc. of WWW 2013 http://dl.acm.org …