投稿日: WWW 論文紹介

Improving relevance judgment of web search results with image excerpts

Li, Zhiwei
Shi, Shuming
Zhang, Lei
In Proc. of WWW2008
http://dl.acm.org/citation.cfm?id=1367497.1367501

概要

SERP中の各検索結果の横に、そのページ内にある最も重要な画像を表示するインタフェースを提案。ページ内にある画像の中で、クエリに関係のある重要な画像を推定することが目的。画像の重要度の推定は以下の2つのスコアの線形和で求める。

  1. 画像自体の重要度(クエリとは無関係)
  2. 画像とクエリの関連度

1. 画像自体の重要度

以下の3つのカテゴリの素性を用いて、機械学習により重要度をスコア付け。学習にはRankBoostという既存手法を使用。

  • Image Level Features
  • 画像サイズや、既存手法で図られる画像のクオリティなど。

  • Page Level Features
  • ページ内での画像の位置やページ内での画像の占める割合など。

  • Website Level Features
  • 画像のURLのホスト名がページのURLのホスト名と一致しているか、他のページでも同じ画像が使用されているかなど(主に広告画像を除くことを目的とした素性)。

2. 画像とクエリの関連度

DOMを用いて画像の周辺テキストを抽出し、ベクトル空間モデルでクエリとの関連度を計算。

実験

MSN.com、MIT.edu、CNN.comをクロールして実験に使用。3000ページをサンプリングして、各ページ内の各画像の重要度を3段階でラベル付けして交差検定。重要かどうかの分類精度は90%以上という結果。

クエリの関連度に関する実験では、Googleトレンドから集めた40クエリを使用。各クエリの検索結果上位20件を対象として、各ページの各画像のクエリに対する重要度をラベル付けして交差検定。最も重要な画像の推定精度は90%近い結果。

User Study

100個のクエリを用いて、通常の検索結果UIと画像を表示するUIで、タスク終了までにクリックされるページ数とタスクの達成時間を比較。
実験の結果、Navigational、Informationalなクエリともに画像を表示した方がクリックされるページ数は少なくタスクの達成時間は短かった。
また、クエリのカテゴリに関わらず、画像を表示した方がクリックされるページ数は少なくタスクの達成時間は短かった。特に、「mutual information」や「thinking」のような抽象的なカテゴリよりも、「apple」や「mountain」のような具体的なカテゴリの方が有用であった。


-WWW, 論文紹介

関連記事

Tagging Your Tweets: A Probabilistic Modeling of Hashtag Annotation in Twitter

Ma, Zongyang Sun, Aixin Yuan, Quan Cong, Gao In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id= …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Extending Faceted Search to the General Web

Kong, Weize Allan, James In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id=2661964 概要 ファセットを提示す …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

Spatial influence vs. community influence: modeling the global spread of social media

Kamath, Krishna Y. Caverlee, James Cheng, Zhiyuan Sui, Daniel Z. In Proc. of CIKM 2012 http://dl.acm …