投稿日: WWW 論文紹介

A Study of Mobile Search Queries in Japan

Ricardo Baeza-yates
Georges Dupret
Javier Velasco
In Proc. of WWW2007

概要

デスクトップ検索とモバイル検索の日本語のクエリログに着目して、クエリのカテゴリを分析。

データ

Yahoo! Japanのクエリログを使用。モバイル検索のクエリログから100万件、デスクトップ検索のクエリログから10万件をサンプリング。

クエリのカテゴリ推定

DMOZの最上位14カテゴリに含まれる文書集合から、各カテゴリの言語モデルを作成。各クエリについて、最も生起確率の高いカテゴリをそのクエリのカテゴリとする。100クエリをサンプリングして評価したところ、精度は90%以上。

結果

デスクトップ、モバイルそれぞれの上位7カテゴリは以下の通り(割合の高い順)。

  • デスクトップ:アート、スポーツ、オンラインショップ、ビジネス、健康、レクリエーション、ゲーム
  • モバイル:スポーツ、ビジネス、オンラインショップ、レクリエーション、健康、アート、家庭

-WWW, 論文紹介

関連記事

Finding Dimensions for Queries

Z. Dou, S. Hu, Y. Luo, R. Song, and JR. Wen In Proc. of CIKM2011 http://dl.acm.org/citation.cfm?id=2 …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …

Who Will You “@”?

Gong, Yeyun and Zhang, Qi and Sun, Xuyang and Huang, Xuanjing In Proc. of CIKM 2015 概要 Twitterではリプライ …

Fighting search engine amnesia: reranking repeated results

Shokouhi, Milad White, Ryen W. Bennett, Paul Radlinski, Filip In Proc. of SIGIR 2013 http://dl.acm.o …

Mining Query Subtopics from Search Log Data

Hu, Yunhua Qian, Yanan Li, Hang Jiang, Daxin Pei, Jian Zheng, Qinghua In Proc. of SIGIR 2012 http:// …