投稿日:2016/07/30 更新日: CIKM 論文紹介

Where you Instagram?: Associating Your Instagram Photos with Points of Interest

Li, Xutao and Pham, Tuan-Anh Nguyen and Cong, Gao and Yuan, Quan and Li, Xiao-Li and Krishnaswamy, Shonali
In Proc. of CIKM 2015

概要

Instagramで撮影された写真がどのPOIで撮影されたものかを推定することを目的とした論文。写真に付与されたテキスト情報、写真の画像特徴量、ユーザのPOIに対する好みを考慮して推定する。ユーザ自ら写真にPOIの情報を付与することもできるが、Instagram上でPOIが付与されている写真は30%未満なので、推定することは各POIに興味のあるユーザに写真を表示したりするアプリケーションのためにも有用である。

先行研究との違い

Flickrの画像が撮影されたLandmarkを推定する研究はある。先行研究の場合、Landmarkには大量の教師画像がFlickrに存在するので学習が楽だったが、Instagramの場合、10枚以上の教師画像が存在するPOIは全体の10%程度で、教師画像の数が少ないので工夫が必要になる。

手法

3カテゴリの特徴量を使用。

  1. Textual context
  2. 写真に付与されたコメントからベクトルを作成。ベクトルの要素は単語の出現回数。テキストのない写真は要素が全て0になるが、Instagramでは90%以上の写真にコメントが付与されている。

  3. Visual context
  4. SIFTを利用して画像をn次元のベクトルで表現。

  5. User preference
  6. ユーザが各POIで写真を撮影した回数だけからユーザのPOIに対する好みを学習すると、データがスパースすぎるので、ユーザとPOIをそれぞれk次元のトピックベクトルで表現。ベクトルの内積によって、ユーザのPOIに対する好みを求める。

Textual contentのベクトルの各要素に対する重み、Visual contextのベクトルの各要素に対する重み、User preferenceのk次元のベクトルの値をSGDで求める。

評価方法

ニューヨークとシンガポールのInstagramのデータを使用。MRRや上位n件に正解が含まれるテストデータの割合で評価し、3カテゴリ全てを考慮した場合の精度が最も高いことを示した。


-CIKM, 論文紹介

関連記事

Fighting search engine amnesia: reranking repeated results

Shokouhi, Milad White, Ryen W. Bennett, Paul Radlinski, Filip In Proc. of SIGIR 2013 http://dl.acm.o …

Search engine click spam detection based on bipartite graph propagation

Li, Xin Zhang, Min Liu, Yiqun Ma, Shaoping Jin, Yijiang Ru, Liyun In Proc. of WSDM 2014 http://dl.ac …

The Last Click: Why Users Give up Information Network Navigation

Aju Thalappillil Scaria Rose Marie Philip Robert West Jure Leskovec In Proc. of WSDM 2014 概要 リンクをたどっ …

Crowdsourcing for relevance evaluation

Alonso, Omar Rose, Daniel E. Stewart, Benjamin In SIGIR Forum, Vol.42, Num.2 http://dl.acm.org/citat …

Lessons from the Journey: A Query Log Analysis of Within-Session Learning

Carsten Eickhoff Jaime Teevan Ryen White Susan T. Dumais In Proc. of WSDM 2014 概要 ユーザの検索トピックに対する専門度は …