投稿日:2013/03/05 更新日: SIGIR 論文紹介

Adaptive Query Suggestion for Difficult Queries

Liu, Yang
Song, Ruihua
Chen, Yu
Nie, Jian-Yun
Wen, Ji-Rong
In Proc. of SIGIR 2012
http://dl.acm.org/citation.cfm?id=2348283.2348289

概要

「what’s in fashon」のような難しいクエリに対して,クエリ推薦を行うことを目的としている.
クエリログから推薦するクエリを5個ランキングして提示する.あらゆるクエリに対してクエリ推薦をするのではなく,クエリの難しさを推定したうえで,難しいクエリに対してのみクエリを推薦する.
「what’s in fashon」というクエリに対して,検索エンジンは「what’s in fashion 2011」のようなクエリを推薦するが,提案手法では「latest fashion trends」のようなクエリが推薦される.

手法

推薦クエリの候補となる集合は,Bingのクエリログから既存手法を用いて集める.続いて,各推薦クエリの適切さをlearning-to-rankにより求めるため,元のクエリqqの検索結果S(q),推薦クエリ候補c_{i}c_{i}の検索結果S(c_{i})から4つの特徴量を抽出する.検索結果は上位10件を使用.
1つ目は,S(c_{i})の検索結果の各タイトルにどれだけc_{i}の語が含まれるかという特徴量.2つ目は,S(c_{i})の検索結果の各タイトルにどれだけqの語が含まれるかという特徴量.3つ目は,S(q)S(c_{i})で共通のURLやドメインがどれだけ含まれるかという特徴量.4つ目は,全推薦クエリ候補の全検索結果に含まれる各URLの頻度をもとにS(c_{i})のNDCGを特徴量としている.

実験

実験には4,068個のクエリを用い,それらのクエリに対して合計638,391個の推薦クエリが得られた.各クエリの検索結果は約100件が人手によりその適切さを5段階でスコア付けしている.各クエリの検索結果のNDCG@3を計算し,その値が低いほど難しいクエリとみなす.各クエリの全推薦クエリ候補について,その検索結果のNDCG@3を計算すると,クエリの難易度が高いものほど,NDCGの値が改善される推薦クエリが多く存在した.元のクエリのNDCGが0以上0.1未満のクエリに対しては,1つのクエリあたり,検索結果が改善される推薦クエリが平均33個あった.また,提案手法では検索エンジンの推薦クエリよりも良い推薦クエリを提示できていることが明らかになった.


-SIGIR, 論文紹介
-

関連記事

Mining long-term search history to improve search accuracy

Tan, Bin Shen, Xuehua Zhai, ChengXiang In Proc. of KDD2006 http://dl.acm.org/citation.cfm?id=1150493 …

Where you Instagram?: Associating Your Instagram Photos with Points of Interest

Li, Xutao and Pham, Tuan-Anh Nguyen and Cong, Gao and Yuan, Quan and Li, Xiao-Li and Krishnaswamy, S …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …

Time-critical search

Mishra, Nina and White, Ryen W. and Ieong, Samuel and Horvitz, Eric In Proc. of SIGIR 2014 概要 一緒にいる人 …

Mining Query Subtopics from Search Log Data

Hu, Yunhua Qian, Yanan Li, Hang Jiang, Daxin Pei, Jian Zheng, Qinghua In Proc. of SIGIR 2012 http:// …