投稿日: SIGIR 論文紹介

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi
Agichtein, Eugene
In Proc. of SIGIR 2010
http://dl.acm.org/citation.cfm?id=1835473

概要

ユーザの検索中の振る舞い(マウスのポインタの位置やスクロールの有無)から,ユーザの検索意図を推定することが目的.
この論文では特に,あるクエリを入力したユーザの意図が調べ物なのか,購入なのかを区別することを目的としている.例えば,blackberryというクエリが入力されたときに,blackberryの製品を購入することが目的のユーザには広告を提示し,blackberryについて調べているユーザには広告を表示しないといったことをすることでユーザのストレスを軽減できる.

手法

タスクの定義:1つ前のクエリと1語以上共通した語が存在する一連のクエリ集合.
使用する特徴量は検索結果ページでの行動のみで,クリックしたページ内での行動は無視.ブラウザを拡張してデータを収集.
機械学習により検索意図を推定する.素性は計127個で大きく6個のグループに分けられる.

  1. クエリ(4個)クエリ長,TLD(.com等)の有無,等
  2. SERPデータ(3個)広告部分のテキスト長,非広告部分のテキスト長さ,等
  3. 検索結果の質(7個)広告の数,検索結果のスニペットに含まれるクエリの数,等
  4. ユーザの行動(99個)マウスを動かす速さ,スクロール量,1つ目の検索結果をクリックするまでの時間,等
  5. クリックデータ(7個)クリックされたURLのユニグラム,ページ滞在時間が30秒以上の「成功」URL,等
  6. コンテキスト(7個)タスクで最初に入力されたクエリか,前のクエリに語を追加したクエリか,等

実験

  • 実験1:調べ物と購入の検索意図の分類
    10人の被験者が自分の好きな製品について調べ物をするタスクと購入するタスクに取り組む.各ユーザの最初から90%のデータをSVMの教師データとして使い,残り10%について調べ物と購入のどちらか推定.全ての素性を使った場合の精度は97%.最も有効な素性はSERPデータであった.

  • 実験2:購入を目的とした検索における広告のクリック率の検証.
    440人のユーザの図書館での検索データ使用.分類には先ほどの実験でつくられたSVMを使用.結果は,調べ物で広告がクリックされる割合が4.1%に対して購入では9.7%と仮説通りの結果に.

  • 実験3:広告のクリックの有無の推定
    上記の440人のデータを用いてCRFにより推定.全体の80%を訓練に使用.実験の結果,全素性を使用した場合,適合率15%,再現率21%でクリックの有無を推定可能.


-SIGIR, 論文紹介
-,

関連記事

The Last Click: Why Users Give up Information Network Navigation

Aju Thalappillil Scaria Rose Marie Philip Robert West Jure Leskovec In Proc. of WSDM 2014 概要 リンクをたどっ …

Explainable User Clustering in Short Text Streams

Zhao, Yukun and Liang, Shangsong and Ren, Zhaochun and Ma, Jun and Yilmaz, Emine and de Rijke, Maart …

Experiments with a Venue-Centric Model for Personalisedand Time-Aware Venue Suggestion

Deveaud, Romain and Albakour, M-Dyaa and Macdonald, Craig and Ounis, Iadh In Proc. of CIKM 2015 概要 ユ …

【論文紹介】Online Actions with Offline Impact: How Online Social Networks Influence Online and Offline User Behavior

Althoff, Tim and Jindal, Pranav and Leskovec, Jure In Proc. of WSDM 2017 概要 スマホのArgusという活動記録アプリのログから …

Improving the exploration of tag spaces using automated tag clustering

Radelaar, Joni Boor, Aart-Jan Vandic, Damir Van Dam, Jan-Willem Hogenboom, Frederik Frasincar, Flavi …