投稿日:2017/07/16 更新日: WSDM 論文紹介

【論文紹介】Bartering Books to Beers: A Recommender System for Exchange Platforms

Rappaz, Jérémie and Vladarean, Maria-Luiza and McAuley, Julian and Catasta, Michele
WSDM 2017
ACM, PDF

概要

ユーザ間の物々交換を目的としたwebサービスにおいて、物々交換が促進されるようなユーザとアイテムの推薦を目的とした論文。より具体的には、サービス上のユーザはwishリストとgive-awayリスト(自分があげることのできるアイテム一覧)を持っている。その下で、アイテムAをあげることのできるユーザXがいたときに、物々交換が高確率で成功しそうな、アイテムBをあげることのできるユーザYを推薦する。ただし、アイテムAがユーザYのwishリストに入っており、かつアイテムBがユーザXのwishリストに入っている、という制約を満たすことは一般に稀であるため、ユーザの潜在的な好みを考慮してマッチングを行う。

予備調査

データセットは、本の交換が可能なBookmooch、ビールの交換が可能なRatebeer、ゲームソフトの交換が可能な/r/gameswapの3種類をクロールして収集。以下の3点を明らかにした。

  1. ユーザの欲しいものはwishリストには十分反映されていない。
    Bookmoochでは、物々交換でユーザが手に入れた本のうち、交換前にユーザのwishリストに入っていた本は33.2%に過ぎなかった。
  2. ユーザは同じ相手と物々交換しがちである。
    一度物々交換をしたユーザ間での総交換回数の平均値はBookmoochで1.35回、Ratebeerで3.56回、/r/gameswapで1.19回であった。
  3. アイテムの人気度とユーザの交換頻度は時間によって変わる。
  4. 年ごとのビールの各種類の交換回数を折れ線グラフで描いて人気度に変化があることを示した。また、1日に複数回交換をするユーザから数ヶ月に1回しか交換をしないユーザまでいることを示した。

手法

予備調査1の結果から、ユーザの潜在的な好みも考慮するためにmatrix factorizationを使用。予備調査2の結果から、ユーザ間の相性を表すバイアス項を追加。さらに、予備調査3の結果から、Kernel Density Estimationを使って、アイテムの人気度とユーザの活発度を表すバイアス項を追加。これにより、ユーザAが、ユーザBの提供するアイテムYを気に入る度合いy(A,B,Y)を計算する。同様に、y(B,A,X)も計算し、ユーザAとBをアイテムXとYでマッチングすべき度合いをy(A,B,Y)とy(B,A,X)の平均値で求める。

パラメータを推定する際は、スコアの絶対値を求めるよりも、スコアの違いによる順位を正確に求める方が重要であるため、Bayesian Personalized Rankingの方法に倣って計算。

評価

ユーザが実際に交換した相手とアイテムのペアを正解データ、実際に交換しなかった相手とアイテムのペアを不正解データとし、正解のペアをどれだけ上位にランキングできるかを評価。通常のMFに加えて、ユーザ間の相性および、アイテムの人気度とユーザの活発度を表すバイアス項を加えたモデルが最も高い精度を記録した。

感想

何らかの仮説を立てて手法を提案し、評価実験で仮説を含めた手法がベースラインを上回っていることで仮説の正しさを示す、というのが一般的な論文の書き方である。それに加えて、この論文のように、仮説の元になるデータを示すことで、論文としての説得力がより増している。仮説の立て方とその手法への反映の仕方がスマートで、さらに、上には書かなかったが、既存研究との違いがかなり丁寧に書かれていて実験では定性的評価も行っていたりと、お手本のような論文の書き方をしていると思った。
下記のページで、データセットとソースコードを公開している。
http://swapit.github.io/


-WSDM, 論文紹介
-, ,

関連記事

【論文紹介】How Much Novelty is Relevant?: It Depends on Your Curiosity

Zhao, Pengfei and Lee, Dik Lun In Proc. of SIGIR 2016 概要 心理学の分野では、対象物の刺激が強すぎても弱すぎても人は惹き付けられず、中程度のとき最 …

【論文紹介】Personalised Rating Prediction for New Users Using Latent Factor Models

Seroussi, Yanir and Bohnert, Fabian and Zukerman, Ingrid In Proc. of HT 2011 概要 映画や書籍に対するユーザのレーティングを …

Using preference judgments for novel document retrieval

Chandar, Praveen Carterette, Ben In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348398 概要 …

Measuring Message Propagation and Social Influence on Twitter.com

Ye, Shaozhi Wu, S. Felix In Proc SocInfo 2010 http://dl.acm.org/citation.cfm?id=1929342 概要 マイケル・ジャクソ …

Towards Better Measurement of Attention and Satisfaction in Mobile Search

Lagun, Dmitry Hsieh, Chih-Hung Webster, Dale Navalpakkam, Vidhya In Proc. of SIGIR2014 http://dl.acm …