投稿日: WSDM 論文紹介

【論文紹介】Anticipating Information Needs Based on Check-in Activity

Benetka, Jan R. and Balog, Krisztian and Nørvåg, Kjetil
WSDM 2017
ACM, PDF

概要

ユーザがある場所(たとえばレストラン)から移動するときに、次の移動先を予測し、適切な情報をスマホに提示することを目的とした論文。たとえば次の移動先がホテルであると予測したら、住所や地図などを提示する。

手法

3ステップから構成される。

ステップ1:POIのカテゴリごとに要求される情報の収集。Foursquareのカテゴリ情報を使用。最上位の9カテゴリ(Foodなど)とそのサブカテゴリの287カテゴリを使用。カテゴリごとに、訪問数の上位200POIを収集。POIの名前と地名をクエリとして、Google Query Suggestion APIを使ってそのPOIに求められる情報を収集。「Victoria Station London」であれば「map」や「shops」といったキーワードが推薦される。似たようなキーワードをまとめるために、カテゴリの200POIに対して集められたキーワードをクラスタリングして、クラスタ内の最頻出語を抽出。これにより、「Food」というカテゴリに対して「map」や「prices」といったキーワードが求まる。キーワードの出現頻度ベースで、各カテゴリにおける各キーワードの重要度を計算。

ステップ2:POIの訪問タイミングによる情報の必要度合いの計算。ステップ1で得られた各キーワードが、POIの訪問前、訪問中、訪問後のどこで必要になるかを計算する。上位9カテゴリを対象にして、たとえば「Food」カテゴリのPOIにとって「map」は3つのうちどのタイミングで必要かをクラウドソーシングで投票してもらう。10人中8人が訪問前と回答したら、「Food」に対する「map」の訪問前の必要度は0.8、のように計算。

ステップ3:移動先のカテゴリ予測に基づく情報のランキング。最後に訪問したカテゴリにおいて重要な情報(ステップ1で得られたキーワード)で、かつ次に移動する確率の高いカテゴリで訪問前に重要な情報ほど上位にランキングされるようなモデルを提案。カテゴリ間の遷移確率はFoursquareのデータを使って事前に計算。

評価

Foursquareのデータを使って、あるユーザがあるタイミングで訪問したPOI1と、その次に訪問したPOI2を取得。提案モデルを使って、POI1を元に情報をランキング。クラウドソーシングのユーザに、POI1とPOI2を見せ、モデルが求めた上位10個の情報に対して有用度を5段階評価してもらい、nDCGで評価。比較手法も複数用意しており、クラウドソーシングでは各手法の上位10個をプーリングして評価している。

感想

ひとつの大きな手法を提案するのではなく、ステップごとに細かい手法を提案して最後にそれを組み合わせた論文で、なんとなくCIKMでよく見かけそうな論文という印象を受けた。イントロでは、各ステップごとのresearch questionを中心に記述されていて、論文全体の見通しがとても良くなる書き方として参考になった。図に関しても、論文の理解を助けるうえで有効な使い方をしており、なおかつ図のクオリティも高かった。

2変数の線形結合で値を求める際に、混合比を決めるパラメータには固定した値を割り当てるか、実験でパラメータを0.1ずつ変化させて精度を測ることが一般的だが、この論文ではパラメータの事前分布としてディリクレ分布を仮定することで、期待値をパラメータに使っている点が参考になった。各変数の出現回数が事前にわかっていてハイパーパラメータとして使える、という条件は必要になるが、クラウドソーシングのように実験にコストがかかる場合、パラメータを少しずつ変化させながら評価することは難しいので、なんとなく混合比を0.5とするよりは理にかなった方法といえる。

カテゴリ単位での評価しかしていないので、カテゴリ内のPOIによってどの程度要求される情報に違いがあるのか、という点は気になった。

参考文献

  • DPClus:エッジが密に張られたクラスタを効率よく抽出するアルゴリズム。
    T. Price, F. I. Peña III, and Y.-R. Cho. Survey: Enhancing protein complex prediction in PPI networks with GO similarity weighting. Interdiscip. Sci., 5(3):196–210, 2013.

-WSDM, 論文紹介
-

関連記事

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

【論文紹介】Will This Paper Increase Your h-index?: Scientific Impact Prediction

Dong, Yuxiao and Johnson, Reid A. and Chawla, Nitesh V. WSDM 2015 ACM, PDF 概要 2007年に発表された論文dは、論文dの中で …

No clicks, no problem: using cursor movements to understand and improve search

Huang, Jeff White, Ryen W. Dumais, Susan In Proc. of CHI2011 概要 検索行動中のユーザのカーソルの動きに関する分析を行った。また、カーソルの …

Extending Faceted Search to the General Web

Kong, Weize Allan, James In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id=2661964 概要 ファセットを提示す …

Personalized Models of Search Satisfaction

Ahmed Hassan Ryen W. White In Proc. of CIKM 2013 概要 ユーザが検索セッションに対して満足したか,不満足だったかを知ることは検索エンジンの質を高めるうえ …