投稿日:2017/06/02 更新日: その他 論文紹介

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco
RecSys 2011
ACM, PDF

概要

コンテキストによるバイアスを考慮したレーティング予測モデルを提案した論文。たとえば、「清水寺」に対するレーティングは、「天気」というコンテキストが「晴れ」の場合はレーティングが高くなるように、「雨」の場合は低くなるようなバイアスを考慮しつつ予測できるようになる。「天気」以外にも「場所」や「時間帯」など、複数のコンテキストを同時に考慮可能なモデルになっている。

手法

基本的には、通常のMatrix Factorizationに、コンテキストによるバイアス項が加わっただけのシンプルなモデル。コンテキストをどの粒度で考慮するかに応じて3種類のモデルを提案している。

  1. アイテムを無視してコンテキストのみ考慮
    「清水寺」であろうと「京都タワー」であろうと、「天気」というコンテキストが「晴れ」であれば一貫してレーティングが高くなるようなバイアスがかかる、といったように、アイテムを無視してコンテキストのみ考慮したモデル。粒度は粗いがパラメータ数は少なくて済む。
  2. アイテムとコンテキストのペアを考慮
    「清水寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかり、「京都タワー」は「晴れ」のときはレーティングが低くなるようなバイアスがかかる、といったように、各アイテムの各コンテキストを考慮したモデル。粒度は細かいがパラメータ数は多くなる。
  3. アイテムのカテゴリごとのコンテキストを考慮
    「清水寺」や「金閣寺」を「寺」カテゴリとして扱い、「寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかる、といったように、アイテムのカテゴリごとにコンテキストを考慮したモデル。粒度、パラメータ数ともに上記の二つのモデルの中間。

評価

コンテキストを考慮したレーティング予測をする際に一般的に用いられるテンソル分解と、モデル(2)を比較。テンソル分解には、コンテキストの数に応じてパラメータ数が指数関数的に増加するというデメリットがある。モデル(2)はパラメータ数はコンテキストの数に対して線形に増加。映画のデータセットを用いた評価実験では、モデル(2)の方がテンソル分解を上回った。

続いて、モデル(1)~(3)を、観光値と音楽のデータセットを用いて比較。いずれもカテゴリ情報はデータセットに含まれている(音楽であればジャンル)。評価の結果、モデル(3)が最も高い精度を示した。


-その他, 論文紹介
-, ,

関連記事

Using preference judgments for novel document retrieval

Chandar, Praveen Carterette, Ben In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348398 概要 …

Semantic Similarity Between Search Engine Queries Using Temporal Correlation

S. Chien, and N. Immorlica In Proc. of WWW 2005 http://dl.acm.org/citation.cfm?id=1060752 目的 クエリログを用 …

Ready to buy or just browsing?: detecting web searcher goals from interaction data

Guo, Qi Agichtein, Eugene In Proc. of SIGIR 2010 http://dl.acm.org/citation.cfm?id=1835473 概要 ユーザの検索 …

Search engine click spam detection based on bipartite graph propagation

Li, Xin Zhang, Min Liu, Yiqun Ma, Shaoping Jin, Yijiang Ru, Liyun In Proc. of WSDM 2014 http://dl.ac …

Time-sensitive query auto-completion

Shokouhi, Milad Radinsky, Kira In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348364 概要 従 …