投稿日: CIKM 論文紹介

Supporting Complex Search Tasks

Ahmed Hassan Awadallah
Ryen W. White
Patrick Pantel
Susan T. Dumais
Yi-Min Wang
In Proc. of CIKM2014

概要

複雑なタスクに関するクエリを入力しているユーザに 対して、興味を引く関連のあるタスクを推薦することを目的とした論文。
例えば、「Cheap Flights to Grand Cayman」というクエリを入力したユーザに対して、「Grand Cayman Car Rental」、「Grand Cayman Vacation Rentals」、「Grand Cayman Hurricane Season」などを推薦する。

タスク推薦までの流れ

大きく分けて以下の5つのステップを通してタスクを推薦する。

  1. クエリログからの複雑なタスクを含むセッション抽出
  2. セッション中のクエリからの複雑なタスク抽出
  3. タスクのクラスタリング
  4. タスクをノードとするグラフ構築
  5. グラフ上のrandom walkを用いたタスク推薦

この中でメインとなるのは2である。

セッション中のクエリからの複雑なタスク抽出

まず、用語の定義を以下のようにする。

  • Entity
  • FreebaseとWikipediaに登録されている人物名や組織名。

  • Collocation
  • 連語。{cheap hotels in new york city}というクエリ内のcheap hotelsとnew yorkなどが該当。

  • Preposition
  • 前置詞。

  • Term
  • 上記以外の語。

  • Pivot
  • クエリ内で主題となるような語。「京都 観光」というクエリであれば「京都」が該当。EntityまたはCollocationから成る。

  • Refiner
  • クエリ内で副題となるような語。「京都 観光」というクエリであれば「観光」が該当。CollocationまたはTermから成る。

以上の定義のもとで、「Refiner Preposition Pivot」、「Pivot Refiner」、「Pivot」のいずれかの形を持つクエリを複雑なタスクを表すクエリとして抽出する。

その後、タスク間の編集距離等に基づいてタスクをクラスタリングし、クラスタ内で最もクエリログ中の出現頻度の高いタスクを代表タスクとして、タスクをノードとするグラフを構築する。枝の重みはクエリログ中でのタスクの共起度に基づいて決める。ユーザの入力があれば、入力に対応するノードにのみ初期値を持たせてrandom walkの要領で値を伝播させ、値の大きいタスクから順にユーザに推薦する。

実験

クラウドソーシングを使用。7種類の手法を用意し、各手法で最大8個まで推薦タスクを提示。Relatedness、Interestingness、Diversity、Completenessの各観点において、各手法の推薦するタスクリストの良さを3段階で評価。

また、提案手法で推薦されるタスクと、従来の関連クエリ推薦手法で推薦されるクエリのどちらが良いかを、同じくRelatedness、Interestingness、Diversity、Completenessの観点から評価。実験の結果、Relatednessのみ従来手法が優れていたが、その他3つの観点では提案手法が優れていた。


-CIKM, 論文紹介

関連記事

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi Agichtein, Eugene In Proc. of SIGIR 2010 http://dl.acm.org/citation.cfm?id=1835473 概要 ユーザの検索 …

Mining long-term search history to improve search accuracy

Tan, Bin Shen, Xuehua Zhai, ChengXiang In Proc. of KDD2006 http://dl.acm.org/citation.cfm?id=1150493 …

Tourist Trip Planning Functionalities: State–of–the–Art and Future

Souffriau, W. Vansteenwegen, P. In Current Trends in Web Engineering http://link.springer.com/chapte …

Good Abandonment in Mobile and PC Internet Search

Li, Jane Huffman, Scott Tokuda, Akihito In Proc of SIGIR2009 http://dl.acm.org/citation.cfm?id=15719 …

Regularization of Latent Variable Models to Obtain Sparsity

Ramnath Balasubramanyan, William W. Cohen In Proc. of SDM 2013 概要 LDAのようなトピックモデルでは、単語が所属するトピックの分布や、文 …