投稿日:2017/07/16 更新日: WSDM 論文紹介

【論文紹介】Bartering Books to Beers: A Recommender System for Exchange Platforms

Rappaz, Jérémie and Vladarean, Maria-Luiza and McAuley, Julian and Catasta, Michele
WSDM 2017
ACM, PDF

概要

ユーザ間の物々交換を目的としたwebサービスにおいて、物々交換が促進されるようなユーザとアイテムの推薦を目的とした論文。より具体的には、サービス上のユーザはwishリストとgive-awayリスト(自分があげることのできるアイテム一覧)を持っている。その下で、アイテムAをあげることのできるユーザXがいたときに、物々交換が高確率で成功しそうな、アイテムBをあげることのできるユーザYを推薦する。ただし、アイテムAがユーザYのwishリストに入っており、かつアイテムBがユーザXのwishリストに入っている、という制約を満たすことは一般に稀であるため、ユーザの潜在的な好みを考慮してマッチングを行う。

予備調査

データセットは、本の交換が可能なBookmooch、ビールの交換が可能なRatebeer、ゲームソフトの交換が可能な/r/gameswapの3種類をクロールして収集。以下の3点を明らかにした。

  1. ユーザの欲しいものはwishリストには十分反映されていない。
    Bookmoochでは、物々交換でユーザが手に入れた本のうち、交換前にユーザのwishリストに入っていた本は33.2%に過ぎなかった。
  2. ユーザは同じ相手と物々交換しがちである。
    一度物々交換をしたユーザ間での総交換回数の平均値はBookmoochで1.35回、Ratebeerで3.56回、/r/gameswapで1.19回であった。
  3. アイテムの人気度とユーザの交換頻度は時間によって変わる。
  4. 年ごとのビールの各種類の交換回数を折れ線グラフで描いて人気度に変化があることを示した。また、1日に複数回交換をするユーザから数ヶ月に1回しか交換をしないユーザまでいることを示した。

手法

予備調査1の結果から、ユーザの潜在的な好みも考慮するためにmatrix factorizationを使用。予備調査2の結果から、ユーザ間の相性を表すバイアス項を追加。さらに、予備調査3の結果から、Kernel Density Estimationを使って、アイテムの人気度とユーザの活発度を表すバイアス項を追加。これにより、ユーザAが、ユーザBの提供するアイテムYを気に入る度合いy(A,B,Y)を計算する。同様に、y(B,A,X)も計算し、ユーザAとBをアイテムXとYでマッチングすべき度合いをy(A,B,Y)とy(B,A,X)の平均値で求める。

パラメータを推定する際は、スコアの絶対値を求めるよりも、スコアの違いによる順位を正確に求める方が重要であるため、Bayesian Personalized Rankingの方法に倣って計算。

評価

ユーザが実際に交換した相手とアイテムのペアを正解データ、実際に交換しなかった相手とアイテムのペアを不正解データとし、正解のペアをどれだけ上位にランキングできるかを評価。通常のMFに加えて、ユーザ間の相性および、アイテムの人気度とユーザの活発度を表すバイアス項を加えたモデルが最も高い精度を記録した。

感想

何らかの仮説を立てて手法を提案し、評価実験で仮説を含めた手法がベースラインを上回っていることで仮説の正しさを示す、というのが一般的な論文の書き方である。それに加えて、この論文のように、仮説の元になるデータを示すことで、論文としての説得力がより増している。仮説の立て方とその手法への反映の仕方がスマートで、さらに、上には書かなかったが、既存研究との違いがかなり丁寧に書かれていて実験では定性的評価も行っていたりと、お手本のような論文の書き方をしていると思った。
下記のページで、データセットとソースコードを公開している。
http://swapit.github.io/


-WSDM, 論文紹介
-, ,

関連記事

Improving the exploration of tag spaces using automated tag clustering

Radelaar, Joni Boor, Aart-Jan Vandic, Damir Van Dam, Jan-Willem Hogenboom, Frederik Frasincar, Flavi …

How fresh do you want your search results?

Shiwen Cheng Anastasios Arvanitis Vagelis Hristidis In Proc. of CIKM 2013 概要 検索結果中の情報の鮮度に着目した研究はこれまで …

Explainable User Clustering in Short Text Streams

Zhao, Yukun and Liang, Shangsong and Ren, Zhaochun and Ma, Jun and Yilmaz, Emine and de Rijke, Maart …

Efficiently answering top-k typicality queries on large databases

Hua, Ming Pei, Jian Fu, Ada W. C. Lin, Xuemin Leung, Ho-Fung In Proc. of VLDB 2007 http://dl.acm.org …

A New Semantic Similarity Measuring Method Based on Web Search Engines

Lu, Gang Huang, Peng He, Lijun Cu, Changyong Li, Xiaobo In W. Trans. on Comp. vol. 9 http://dl.acm.o …