投稿日: その他 論文紹介

【論文紹介】Local implicit feedback mining for music recommendation

Yang, Diyi and Chen, Tianqi and Zhang, Weinan and Lu, Qiuxia and Yu, Yong
RecSys 2012
ACM, PDF

概要

あるユーザが、普段はロックを聴くけれど寝るときはジャズを聴く、といったような、局所的な好み(local preference)を考慮した音楽推薦手法を提案している。推薦を行う直前(1分、1時間、1日、1週間のいずれか)の音楽に対するレーティングから、局所的好みを推定する。Matrix factorization(MF)に局所的な好みを取り入れることで推薦を実現。

手法

KorenはKDD 2008で、ユーザのアイテムに対するレーティングスコアに加えて、ユーザがアイテムにレーティングしたか否かのバイナリ情報をimplicit feedbackとしてMFに取り入れた手法を提案している(PDF)。
本論文の手法では、それに加えて、直近の時間(1分、1時間、1日、1週間のいずれか)でユーザがレーティングしたアイテム情報も考慮している。レーティングのスコアは用いず、レーティングしたか否かだけを使っている。Korenの提案したMFとの違いはそこだけ。効率的にパラメータを推定するためのアルゴリズムも提案している。

評価

Yhoo! Music、Last.fm、Douban Musicの3種類のデータセットを使用してレーティングの予測精度をRMSEとRecall@Kで評価。Recall@Kでは、まずテストデータの中でユーザが高評価した曲(たとえば100曲)を選び、評価値の予測の対象とする。評価値を予測する曲ごとにユーザが未評価の曲1,000曲をランダムに選び、1,001曲をランキングしたときに上位K位以内にユーザが高評価した曲が含まれるものが100曲中何曲あるか、をRecall@Kとする。Yahoo! MusicとLast.fmでは評価の時間が1分単位で記録されていて、Douban Musicでは1日単位で記録されている。

いずれのデータセットでも、直前の1分、1時間、1日、1週間の評価値を考慮した結果はすべて通常のMFの結果を上回っていた。各データセットの各ユーザについて、ユーザが評価した曲を評価した時間順に並べたときに、隣接する曲の評価時間の間隔はどれぐらい空いているかを調べたところ、Yahoo! Musicでは1分未満が60%弱、Last.fmでは1分~1時間が80%強、Douban Musicでは1日未満が70%強となっていた。この結果と予測精度は見事にリンクしていて、Yahoo! Musicでは直前1分のレーティングを考慮した場合のRMSEが最も精度が高く、Last.fmでは直前1時間、Douban Musicでは直前1日のレーティングを考慮した場合のRecall@Kが最も精度が高かった。

感想

提案手法はシンプルな拡張であるが、精度は通常のMFに比べて大きく改善されているのはすごいと思った。Yahoo! Musicでは時間的に隣接する評価の60%が1分未満の間に行われているということだったが、曲を聴くのに数分かかることを考えると、1分未満の評価がここまで多いというのがどういう状況でユーザが評価しているのかよく分からなかった。3つのデータセットすべてで、評価時間の間隔の最頻値となる時間のレーティングを考慮したときに予測精度が最も高くなるのは非常に綺麗な結果だが、Yahoo! MusicではRMSEの結果だけ、Last.fmとDouban MusicではRecall@Kの結果しか掲載されていなかった。こういう書き方をされると、Yahoo! MusicのRecall@K、Last.fmとDouban MusicのRMSEはその法則に当てはまってなかったから載せなかったのかな、とうがった見方をついしてしまう。


-その他, 論文紹介
-,

関連記事

Good Abandonment in Mobile and PC Internet Search

Li, Jane Huffman, Scott Tokuda, Akihito In Proc of SIGIR2009 http://dl.acm.org/citation.cfm?id=15719 …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Fighting search engine amnesia: reranking repeated results

Shokouhi, Milad White, Ryen W. Bennett, Paul Radlinski, Filip In Proc. of SIGIR 2013 http://dl.acm.o …

【論文紹介】What Makes a Link Successful on Wikipedia?

Dimitrov, Dimitar and Singer, Philipp and Lemmerich, Florian and Strohmaier, Markus WWW 2017 ACM, PD …

Mining Contentious Documents Using an Unsupervised Topic Model Based Approach

Amine, Trabelsi and Osmar R., Zaiane In Proc. of ICDM 2014 概要 ある話題に関する文書集合が与えられたときに、「賛成」や「反対」などの各観点( …