投稿日:2015/05/13 更新日: その他 論文紹介

Can social features help learning to rank youtube videos?

Chelaru, Sergiu Viorel
Orellana-Rodriguez, Claudia
Altingovde, Ismail Sengor
In Proc. of WISE 2012

概要

動画のタイトルとタグに加えて、コメントやお気に入り数、動画投稿者の情報といったソーシャルな要素を考慮することで、検索精度が上昇することを示した論文。

データ

クエリの収集は、YouTubeのクエリボックスにaa、ab、…、zzと入力して、query suggestionで表示された上位10件ずつを使用。各クエリの検索結果の動画を最大で300件ずつ取得。クエリの大部分は音楽に関するもの。また、46%は人物名で9%は製品名。

検索時の各素性の有用性

素性はBasic featuresとSocial featuresの2カテゴリを用意。Basic featuresはタイトルを使った検索結果とタグを使った検索結果。Social featuresはコメントを使った検索結果やLike数を使った検索結果など、11種類の検索結果を用意。
サンプリングした50クエリに対して、13種類の検索結果の上位10件をプールして、クエリとの関連度を4段階で評価。計3500のクエリと動画のペアを評価。
NDCGを計算したところ、Basic featuresの方がSocial featuresよりも検索精度が高かった。Social featuresの中では、コメントを使った検索結果が最もスコアが高かった。
上位10件の検索結果の類似度合いを調べたところ、Basic features同士、Social features同士は類似度が高い傾向にあり、Basic featuresとSocial featuresでは類似度は低い傾向にあった。

Learning to rankへの適用

RankSVMやRankBoostなど、6種類のlearning to rankの手法を使って検索精度を評価。いずれの手法でも、Basic featuresだけを使ったlearning to rankよりも、Social featuresも加えた方がNDCGの値は高くなった。


-その他, 論文紹介

関連記事

Measuring Message Propagation and Social Influence on Twitter.com

Ye, Shaozhi Wu, S. Felix In Proc SocInfo 2010 http://dl.acm.org/citation.cfm?id=1929342 概要 マイケル・ジャクソ …

Experiments with a Venue-Centric Model for Personalisedand Time-Aware Venue Suggestion

Deveaud, Romain and Albakour, M-Dyaa and Macdonald, Craig and Ounis, Iadh In Proc. of CIKM 2015 概要 ユ …

Struggling or Exploring? Disambiguating Search Sessions

Ahmed Hassan Ryen W. White Susan Dumais Yi-Min Wang In Proc. of WSDM2014 概要 長い検索セッションには,ユーザが情報の探索をして …

Modelling User Interest for Zero-query Ranking

Liu Yang, Qi Guo, Yang Song, Sha Meng, Milad Shokouhi, Kieran McDonald, and W. Bruce Croft In Proc. …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …