投稿日: その他 論文紹介

【論文紹介】Matrix factorization techniques for context aware recommendation

Baltrunas, Linas and Ludwig, Bernd and Ricci, Francesco
RecSys 2011
Link

概要

コンテキストによるバイアスを考慮したレーティング予測モデルを提案した論文。たとえば、「清水寺」に対するレーティングは、「天気」というコンテキストが「晴れ」の場合はレーティングが高くなるように、「雨」の場合は低くなるようなバイアスを考慮しつつ予測できるようになる。「天気」以外にも「場所」や「時間帯」など、複数のコンテキストを同時に考慮可能なモデルになっている。

手法

基本的には、通常のMatrix Factorizationに、コンテキストによるバイアス項が加わっただけのシンプルなモデル。コンテキストをどの粒度で考慮するかに応じて3種類のモデルを提案している。

  1. アイテムを無視してコンテキストのみ考慮
    「清水寺」であろうと「京都タワー」であろうと、「天気」というコンテキストが「晴れ」であれば一貫してレーティングが高くなるようなバイアスがかかる、といったように、アイテムを無視してコンテキストのみ考慮したモデル。粒度は粗いがパラメータ数は少なくて済む。
  2. アイテムとコンテキストのペアを考慮
    「清水寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかり、「京都タワー」は「晴れ」のときはレーティングが低くなるようなバイアスがかかる、といったように、各アイテムの各コンテキストを考慮したモデル。粒度は細かいがパラメータ数は多くなる。
  3. アイテムのカテゴリごとのコンテキストを考慮
    「清水寺」や「金閣寺」を「寺」カテゴリとして扱い、「寺」は「晴れ」のときはレーティングが高くなるようなバイアスがかかる、といったように、アイテムのカテゴリごとにコンテキストを考慮したモデル。粒度、パラメータ数ともに上記の二つのモデルの中間。

評価

コンテキストを考慮したレーティング予測をする際に一般的に用いられるテンソル分解と、モデル(2)を比較。テンソル分解には、コンテキストの数に応じてパラメータ数が指数関数的に増加するというデメリットがある。モデル(2)はパラメータ数はコンテキストの数に対して線形に増加。映画のデータセットを用いた評価実験では、モデル(2)の方がテンソル分解を上回った。

続いて、モデル(1)~(3)を、観光値と音楽のデータセットを用いて比較。いずれもカテゴリ情報はデータセットに含まれている(音楽であればジャンル)。評価の結果、モデル(3)が最も高い精度を示した。


-その他, 論文紹介
-,

関連記事

Information Credibility on Twitter

Castillo, Carlos Mendoza, Marcelo Poblete, Barbara In Proc. of WWW 2011 http://dl.acm.org/citation.c …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …

Your neighbors affect your ratings: on geographical neighborhood influence to rating prediction

Hu, Longke and Sun, Aixin and Liu, Yong In Proc. of SIGIR 2014 概要 店sの周辺の店の情報を利用することで、ユーザuのsに対するレーティン …

【論文紹介】Exploiting Geographical Influence for Collaborative Point-of-Interest Recommendation

Ye, Mao and Yin, Peifeng and Lee, Wang-Chien and Lee, Dik-Lun In Proc. of SIGIR 2011 概要 POIに対するユーザの興 …

Unexpected Relevance: An Empirical Study of Serendipity in Retweets

Tao Sun Ming Zhang Qiaozhu Mei In Proc. of ICWSM 2013 概要 Serendipityな情報とはどのようなものかを定義した論文.また,その定義に基づい …