投稿日: SIGIR 論文紹介

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi
Agichtein, Eugene
In Proc. of SIGIR 2010
http://dl.acm.org/citation.cfm?id=1835473

概要

ユーザの検索中の振る舞い(マウスのポインタの位置やスクロールの有無)から,ユーザの検索意図を推定することが目的.
この論文では特に,あるクエリを入力したユーザの意図が調べ物なのか,購入なのかを区別することを目的としている.例えば,blackberryというクエリが入力されたときに,blackberryの製品を購入することが目的のユーザには広告を提示し,blackberryについて調べているユーザには広告を表示しないといったことをすることでユーザのストレスを軽減できる.

手法

タスクの定義:1つ前のクエリと1語以上共通した語が存在する一連のクエリ集合.
使用する特徴量は検索結果ページでの行動のみで,クリックしたページ内での行動は無視.ブラウザを拡張してデータを収集.
機械学習により検索意図を推定する.素性は計127個で大きく6個のグループに分けられる.

  1. クエリ(4個)クエリ長,TLD(.com等)の有無,等
  2. SERPデータ(3個)広告部分のテキスト長,非広告部分のテキスト長さ,等
  3. 検索結果の質(7個)広告の数,検索結果のスニペットに含まれるクエリの数,等
  4. ユーザの行動(99個)マウスを動かす速さ,スクロール量,1つ目の検索結果をクリックするまでの時間,等
  5. クリックデータ(7個)クリックされたURLのユニグラム,ページ滞在時間が30秒以上の「成功」URL,等
  6. コンテキスト(7個)タスクで最初に入力されたクエリか,前のクエリに語を追加したクエリか,等

実験

  • 実験1:調べ物と購入の検索意図の分類
    10人の被験者が自分の好きな製品について調べ物をするタスクと購入するタスクに取り組む.各ユーザの最初から90%のデータをSVMの教師データとして使い,残り10%について調べ物と購入のどちらか推定.全ての素性を使った場合の精度は97%.最も有効な素性はSERPデータであった.

  • 実験2:購入を目的とした検索における広告のクリック率の検証.
    440人のユーザの図書館での検索データ使用.分類には先ほどの実験でつくられたSVMを使用.結果は,調べ物で広告がクリックされる割合が4.1%に対して購入では9.7%と仮説通りの結果に.

  • 実験3:広告のクリックの有無の推定
    上記の440人のデータを用いてCRFにより推定.全体の80%を訓練に使用.実験の結果,全素性を使用した場合,適合率15%,再現率21%でクリックの有無を推定可能.


-SIGIR, 論文紹介
-,

関連記事

Towards Better Measurement of Attention and Satisfaction in Mobile Search

Lagun, Dmitry Hsieh, Chih-Hung Webster, Dale Navalpakkam, Vidhya In Proc. of SIGIR2014 http://dl.acm …

Modeling User Posting Behavior on Social Media

Xu, Zhiheng Zhang, Yang Wu, Yao Yang, Qing In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id= …

Efficient multiple-click models in web search

Guo, Fan Liu, Chao Wang, Yi Min In Proc. of WSDM2009 概要 クリックモデルに関するこれまでの研究では、ユーザはクエリを入力して1度検索結果をクリック …

Mining Contentious Documents Using an Unsupervised Topic Model Based Approach

Amine, Trabelsi and Osmar R., Zaiane In Proc. of ICDM 2014 概要 ある話題に関する文書集合が与えられたときに、「賛成」や「反対」などの各観点( …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …