投稿日:2013/03/05 更新日: SIGIR 論文紹介

Adaptive Query Suggestion for Difficult Queries

Liu, Yang
Song, Ruihua
Chen, Yu
Nie, Jian-Yun
Wen, Ji-Rong
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348283.2348289

概要

「what’s in fashon」のような難しいクエリに対して,クエリ推薦を行うことを目的としている.
クエリログから推薦するクエリを5個ランキングして提示する.あらゆるクエリに対してクエリ推薦をするのではなく,クエリの難しさを推定したうえで,難しいクエリに対してのみクエリを推薦する.
「what’s in fashon」というクエリに対して,検索エンジンは「what’s in fashion 2011」のようなクエリを推薦するが,提案手法では「latest fashion trends」のようなクエリが推薦される.

手法

推薦クエリの候補となる集合は,Bingのクエリログから既存手法を用いて集める.続いて,各推薦クエリの適切さをlearning-to-rankにより求めるため,元のクエリqqの検索結果S(q),推薦クエリ候補c_{i}c_{i}の検索結果S(c_{i})から4つの特徴量を抽出する.検索結果は上位10件を使用.
1つ目は,S(c_{i})の検索結果の各タイトルにどれだけc_{i}の語が含まれるかという特徴量.2つ目は,S(c_{i})の検索結果の各タイトルにどれだけqの語が含まれるかという特徴量.3つ目は,S(q)S(c_{i})で共通のURLやドメインがどれだけ含まれるかという特徴量.4つ目は,全推薦クエリ候補の全検索結果に含まれる各URLの頻度をもとにS(c_{i})のNDCGを特徴量としている.

実験

実験には4,068個のクエリを用い,それらのクエリに対して合計638,391個の推薦クエリが得られた.各クエリの検索結果は約100件が人手によりその適切さを5段階でスコア付けしている.各クエリの検索結果のNDCG@3を計算し,その値が低いほど難しいクエリとみなす.各クエリの全推薦クエリ候補について,その検索結果のNDCG@3を計算すると,クエリの難易度が高いものほど,NDCGの値が改善される推薦クエリが多く存在した.元のクエリのNDCGが0以上0.1未満のクエリに対しては,1つのクエリあたり,検索結果が改善される推薦クエリが平均33個あった.また,提案手法では検索エンジンの推薦クエリよりも良い推薦クエリを提示できていることが明らかになった.


-SIGIR, 論文紹介
-

関連記事

Where you Instagram?: Associating Your Instagram Photos with Points of Interest

Li, Xutao and Pham, Tuan-Anh Nguyen and Cong, Gao and Yuan, Quan and Li, Xiao-Li and Krishnaswamy, S …

Happy, Nervous or Surprised? Classification of Human Affective States in Social Media

Munmun De Choudhury Michael Gamon Scott Counts In Proc. of ICWSM 2012 概要 ツイートを11種類の感情に分類することを目的とした論文 …

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew Dominowska, Ewa Ragno, Robert In Proc. of WWW2007 概要 検索結果の横に表示される広告のCTRの推定を目的として …

Quantifying Controversy in Social Media

Garimella, Kiran De Francisci Morales, Gianmarco Gionis, Aristides Mathioudakis, Michael In Proc. of …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …