投稿日:2015/05/13 更新日: その他 論文紹介

Can social features help learning to rank youtube videos?

Chelaru, Sergiu Viorel
Orellana-Rodriguez, Claudia
Altingovde, Ismail Sengor
In Proc. of WISE 2012

概要

動画のタイトルとタグに加えて、コメントやお気に入り数、動画投稿者の情報といったソーシャルな要素を考慮することで、検索精度が上昇することを示した論文。

データ

クエリの収集は、YouTubeのクエリボックスにaa、ab、…、zzと入力して、query suggestionで表示された上位10件ずつを使用。各クエリの検索結果の動画を最大で300件ずつ取得。クエリの大部分は音楽に関するもの。また、46%は人物名で9%は製品名。

検索時の各素性の有用性

素性はBasic featuresとSocial featuresの2カテゴリを用意。Basic featuresはタイトルを使った検索結果とタグを使った検索結果。Social featuresはコメントを使った検索結果やLike数を使った検索結果など、11種類の検索結果を用意。
サンプリングした50クエリに対して、13種類の検索結果の上位10件をプールして、クエリとの関連度を4段階で評価。計3500のクエリと動画のペアを評価。
NDCGを計算したところ、Basic featuresの方がSocial featuresよりも検索精度が高かった。Social featuresの中では、コメントを使った検索結果が最もスコアが高かった。
上位10件の検索結果の類似度合いを調べたところ、Basic features同士、Social features同士は類似度が高い傾向にあり、Basic featuresとSocial featuresでは類似度は低い傾向にあった。

Learning to rankへの適用

RankSVMやRankBoostなど、6種類のlearning to rankの手法を使って検索精度を評価。いずれの手法でも、Basic featuresだけを使ったlearning to rankよりも、Social featuresも加えた方がNDCGの値は高くなった。


-その他, 論文紹介

関連記事

Collective intelligence in the online social network of yahoo!answers and its implications

Li, Ze Shen, Haiying Grant, Joseph Edward In Proc. of CIKM 2012 http://dl.acm.org/citation.cfm?id=23 …

What are you looking for? An eye-tracking study of information usage in Web search

Cutrell, Edward Guan, Zhiwei In Proc. of CHI2007 http://dl.acm.org/citation.cfm?id=1240690 概要 デスクトップ …

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff Efthimiadis, Efthimis N. In Proc. of CIKM2009 http://dl.acm.org/citation.cfm?id=1645966 …

Extending Faceted Search to the General Web

Kong, Weize Allan, James In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id=2661964 概要 ファセットを提示す …

Web Object Retrieval

Nie, Zaiqing Ma, Yunxiao Shi, Shuming Wen, Ji-Rong Ma, Wei-Ying In Proc. of WWW 2007 http://dl.acm.o …