投稿日: CIKM 論文紹介

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff
Efthimiadis, Efthimis N.
In Proc. of CIKM2009
http://dl.acm.org/citation.cfm?id=1645966

概要

1日に入力される20億クエリのうち、約28%は直前に入力したクエリのreformulationであることが知られている。
この論文ではクエリのreformulationの種類を整理して、各種類に分類するためのルールを構築。実際のクエリログを用いて分類し、種類間でのユーザの振る舞いの違いを分析。

Taxonomy

クエリのreformulationを以下の11種類に分類。

  1. word reorder
    例:seattle pizza palace → pizza seattle palace
  2. whitespace and punctuation
    例:wal mart, tomatoprices → walmart tomato prices
  3. remove words
    例:yahoo stock price → price yahoo
  4. add words
    例:eastlake home → eastlake home price index
  5. url stripping
    例:http www.yahoo.com → yahoo
  6. stemming
    例:running over bridges → run over bridge
  7. acronym
    例:personal computer → pc、pda → personal digital assistant
  8. substring
    例:is there spyware on my computer → is there spywa
  9. abbreviation
    例:shortened dict → short dictionary
  10. word substitution
    例:easter egg search → easter egg hunt
  11. spelling correction
    例:reformualtion → reformulation

クエリログ分析

上記の各taxonomyに対応する分類ルールを作成して、AOLのクエリログに適用したところ、適合率は98.2%を達成。

ユーザの行動には、1つ目のクエリで検索結果をクリックしたか否か(Click or Skip)、修正したクエリで検索結果をクリックしたか否かの組み合わせで4パターンに分類される。ClickClick+ClickSkipに対するSkipSkip+SkipClickの割合を調べたところ、spelling correlationとexpand acronymとsupersutringではその値が高く、検索結果に満足していないのでクエリのreformulationが行われていることがわかる。Form acronym、remove words、word reorder、word substitutionではその値は低く、ユーザは1つ目のクエリである程度満足しているが何らかの理由でクエリのreformulationをしていることがわかる。

Word substitutionとadd / remove wordsでは、reformulation後にクリックする検索結果の順位が大きく上昇しており、reformulationが上手く行われていることを示している。


-CIKM, 論文紹介

関連記事

Web Object Retrieval

Nie, Zaiqing Ma, Yunxiao Shi, Shuming Wen, Ji-Rong Ma, Wei-Ying In Proc. of WWW 2007 http://dl.acm.o …

【論文紹介】Will This Paper Increase Your h-index?: Scientific Impact Prediction

Dong, Yuxiao and Johnson, Reid A. and Chawla, Nitesh V. WSDM 2015 ACM, PDF 概要 2007年に発表された論文dは、論文dの中で …

No clicks, no problem: using cursor movements to understand and improve search

Huang, Jeff White, Ryen W. Dumais, Susan In Proc. of CHI2011 概要 検索行動中のユーザのカーソルの動きに関する分析を行った。また、カーソルの …

Re-Examining Search Result Snippet Examination Time for Relevance Estimation

Lagun, Dmitry Agichtein, Eugene In Proc. of SIGIR2012 http://dl.acm.org/citation.cfm?id=2348509 概要 従 …

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew Dominowska, Ewa Ragno, Robert In Proc. of WWW2007 概要 検索結果の横に表示される広告のCTRの推定を目的として …