投稿日: その他 論文紹介

【論文紹介】Local implicit feedback mining for music recommendation

Yang, Diyi and Chen, Tianqi and Zhang, Weinan and Lu, Qiuxia and Yu, Yong
RecSys 2012
ACM, PDF

概要

あるユーザが、普段はロックを聴くけれど寝るときはジャズを聴く、といったような、局所的な好み(local preference)を考慮した音楽推薦手法を提案している。推薦を行う直前(1分、1時間、1日、1週間のいずれか)の音楽に対するレーティングから、局所的好みを推定する。Matrix factorization(MF)に局所的な好みを取り入れることで推薦を実現。

手法

KorenはKDD 2008で、ユーザのアイテムに対するレーティングスコアに加えて、ユーザがアイテムにレーティングしたか否かのバイナリ情報をimplicit feedbackとしてMFに取り入れた手法を提案している(PDF)。
本論文の手法では、それに加えて、直近の時間(1分、1時間、1日、1週間のいずれか)でユーザがレーティングしたアイテム情報も考慮している。レーティングのスコアは用いず、レーティングしたか否かだけを使っている。Korenの提案したMFとの違いはそこだけ。効率的にパラメータを推定するためのアルゴリズムも提案している。

評価

Yhoo! Music、Last.fm、Douban Musicの3種類のデータセットを使用してレーティングの予測精度をRMSEとRecall@Kで評価。Recall@Kでは、まずテストデータの中でユーザが高評価した曲(たとえば100曲)を選び、評価値の予測の対象とする。評価値を予測する曲ごとにユーザが未評価の曲1,000曲をランダムに選び、1,001曲をランキングしたときに上位K位以内にユーザが高評価した曲が含まれるものが100曲中何曲あるか、をRecall@Kとする。Yahoo! MusicとLast.fmでは評価の時間が1分単位で記録されていて、Douban Musicでは1日単位で記録されている。

いずれのデータセットでも、直前の1分、1時間、1日、1週間の評価値を考慮した結果はすべて通常のMFの結果を上回っていた。各データセットの各ユーザについて、ユーザが評価した曲を評価した時間順に並べたときに、隣接する曲の評価時間の間隔はどれぐらい空いているかを調べたところ、Yahoo! Musicでは1分未満が60%弱、Last.fmでは1分~1時間が80%強、Douban Musicでは1日未満が70%強となっていた。この結果と予測精度は見事にリンクしていて、Yahoo! Musicでは直前1分のレーティングを考慮した場合のRMSEが最も精度が高く、Last.fmでは直前1時間、Douban Musicでは直前1日のレーティングを考慮した場合のRecall@Kが最も精度が高かった。

感想

提案手法はシンプルな拡張であるが、精度は通常のMFに比べて大きく改善されているのはすごいと思った。Yahoo! Musicでは時間的に隣接する評価の60%が1分未満の間に行われているということだったが、曲を聴くのに数分かかることを考えると、1分未満の評価がここまで多いというのがどういう状況でユーザが評価しているのかよく分からなかった。3つのデータセットすべてで、評価時間の間隔の最頻値となる時間のレーティングを考慮したときに予測精度が最も高くなるのは非常に綺麗な結果だが、Yahoo! MusicではRMSEの結果だけ、Last.fmとDouban MusicではRecall@Kの結果しか掲載されていなかった。こういう書き方をされると、Yahoo! MusicのRecall@K、Last.fmとDouban MusicのRMSEはその法則に当てはまってなかったから載せなかったのかな、とうがった見方をついしてしまう。


-その他, 論文紹介
-,

関連記事

Retrieval models for question and answer archives

Xue, Xiaobing Jeon, Jiwoon Croft, W. Bruce In Proc. of SIGIR 2008 http://dl.acm.org/citation.cfm?id= …

Spatio-temporal Dynamics of Online Memes: A Study of Geo-tagged Tweets

Kamath, Krishna Y. Caverlee, James Lee, Kyumin Cheng, Zhiyuan In Proc. of WWW 2013 http://dl.acm.org …

Exploring and exploiting user search behavior on mobile and tablet devices to improve search relevance

Song, Yang Ma, Hao Wang, Hongning Wang, Kuansan In Proc. of WWW 2013 http://dl.acm.org/citation.cfm? …

【論文紹介】Generative Feature Language Models for Mining Implicit Features from Customer Reviews

Karmaker Santu, Shubhra Kanti and Sondhi, Parikshit and Zhai, ChengXiang CIKM 2016 ACM 概要 イリノイ大学のChe …

Modeling User Interest and Community Interest in Microbloggings: An Integrated Approach

Tuan-Anh Hoang In Proc. of PAKDD 2015 概要 ツイッターユーザの興味と所属するコミュニティを、ユーザのツイート内容と振る舞い(リツイート、メンション、ハッシュタグの …