投稿日:2015/05/13 更新日: その他 論文紹介

Can social features help learning to rank youtube videos?

Chelaru, Sergiu Viorel
Orellana-Rodriguez, Claudia
Altingovde, Ismail Sengor
In Proc. of WISE 2012

概要

動画のタイトルとタグに加えて、コメントやお気に入り数、動画投稿者の情報といったソーシャルな要素を考慮することで、検索精度が上昇することを示した論文。

データ

クエリの収集は、YouTubeのクエリボックスにaa、ab、…、zzと入力して、query suggestionで表示された上位10件ずつを使用。各クエリの検索結果の動画を最大で300件ずつ取得。クエリの大部分は音楽に関するもの。また、46%は人物名で9%は製品名。

検索時の各素性の有用性

素性はBasic featuresとSocial featuresの2カテゴリを用意。Basic featuresはタイトルを使った検索結果とタグを使った検索結果。Social featuresはコメントを使った検索結果やLike数を使った検索結果など、11種類の検索結果を用意。
サンプリングした50クエリに対して、13種類の検索結果の上位10件をプールして、クエリとの関連度を4段階で評価。計3500のクエリと動画のペアを評価。
NDCGを計算したところ、Basic featuresの方がSocial featuresよりも検索精度が高かった。Social featuresの中では、コメントを使った検索結果が最もスコアが高かった。
上位10件の検索結果の類似度合いを調べたところ、Basic features同士、Social features同士は類似度が高い傾向にあり、Basic featuresとSocial featuresでは類似度は低い傾向にあった。

Learning to rankへの適用

RankSVMやRankBoostなど、6種類のlearning to rankの手法を使って検索精度を評価。いずれの手法でも、Basic featuresだけを使ったlearning to rankよりも、Social featuresも加えた方がNDCGの値は高くなった。


-その他, 論文紹介

関連記事

Mobile App Retrieval for Social Media Users via Inference of Implicit Intent in Social Media Text

Park, Dae Hoon and Fang, Yi and Liu, Mengwen and Zhai, ChengXiang In Proc. of CIKM 2016 概要 ツイートに含まれる …

Addressing people’s information needs directly in a web search result page

Chilton, Lydia B. Teevan, Jaime In Proc. of WWW 2011 http://dl.acm.org/citation.cfm?id=1963413 概要 最近 …

【論文紹介】Generative Feature Language Models for Mining Implicit Features from Customer Reviews

Karmaker Santu, Shubhra Kanti and Sondhi, Parikshit and Zhai, ChengXiang CIKM 2016 ACM 概要 イリノイ大学のChe …

No clicks, no problem: using cursor movements to understand and improve search

Huang, Jeff White, Ryen W. Dumais, Susan In Proc. of CHI2011 概要 検索行動中のユーザのカーソルの動きに関する分析を行った。また、カーソルの …

TwitterRank: Finding Topic-sensitive Influential Twitterers

Weng, Jianshu Lim, Ee-Peng Jiang, Jing He, Qi In Proc. of WSDM 2010 http://dl.acm.org/citation.cfm?i …