投稿日: SIGIR 論文紹介

Time-critical search

Mishra, Nina and White, Ryen W. and Ieong, Samuel and Horvitz, Eric
In Proc. of SIGIR 2014

概要

一緒にいる人が心臓発作で倒れた時の検索、のように医療関連で緊急を要する検索に着目した初めての研究。そのような研究がどの程度行われているかを予備調査により明らかにした上で、あるユーザのひとつのセッション内の一連のクエリが与えられたときに、それが緊急を要するセッションであるか否かを予測する分類器を構築。

予備調査

AMTで、この1年の間に医療に関する問題で緊急を要する場面に遭遇した133名を対象として調査を行った結果、12%のユーザは緊急時にWeb検索を行ったと回答した。検索を行ったユーザのうち17%は検索結果に不満を持っていた。

緊急を要する検索セッションの分類

モバイルデバイスによって行われたBing検索のクエリログを使用して、以下の要領で正例(緊急を要するセッション)と負例を取得。

  1. health queryを含むセッションを抽出。
  2. アダルトコンテンツを含むセッションを排除。
  3. 残ったセッションのうち、救命センター自体の検索、救命センターの電話番号や行き方を検索したセッションを正例、それ以外のセッションを負例として抽出。

全セッションの99.4%は負例なので、分類精度を評価する際は正例と同数の負例をサンプリングして使用。セッションを分類するために、以下のカテゴリの素性を利用:Bag of Words、Historic Query Statistics、User-Related、Behavioral、Geospatial、Temporal、Topical。分類にはboosted tree classifierを使用。


-SIGIR, 論文紹介

関連記事

Retrieval models for question and answer archives

Xue, Xiaobing Jeon, Jiwoon Croft, W. Bruce In Proc. of SIGIR 2008 http://dl.acm.org/citation.cfm?id= …

Mining Contentious Documents Using an Unsupervised Topic Model Based Approach

Amine, Trabelsi and Osmar R., Zaiane In Proc. of ICDM 2014 概要 ある話題に関する文書集合が与えられたときに、「賛成」や「反対」などの各観点( …

【論文紹介】Cats and Captions vs. User Characteristics and the Clock: A Time-Controlled Analysis of Multimodal Content

Hessel, Jack and Lee, Lillian and Mimno David In Proc. of WWW 2017 概要 Redditと呼ばれるソーシャルニュースサイトに投稿された画 …

Personalized Models of Search Satisfaction

Ahmed Hassan Ryen W. White In Proc. of CIKM 2013 概要 ユーザが検索セッションに対して満足したか,不満足だったかを知ることは検索エンジンの質を高めるうえ …

【論文紹介】Personalised Rating Prediction for New Users Using Latent Factor Models

Seroussi, Yanir and Bohnert, Fabian and Zukerman, Ingrid In Proc. of HT 2011 概要 映画や書籍に対するユーザのレーティングを …