投稿日:2015/05/11 更新日: その他 論文紹介

Are Web User Comments Useful for Search?

Wai Gen Yee
Andrew Yates
Shizhu Liu
Ophir Frieder
In Proc. of LSDS-IR Workshop 2009

概要

YouTubeの動画を検索する際に、動画のタイトルと説明文に加えてコメントも利用することで検索精度が上昇することを示した論文。

データ

動画セットとして4種類を用意。rand3500はランダムに選択した3500件、pop500はAPIを使って取得できる人気度の高い500件。同様にrand10Kとpop1500も用意。
popな動画の方がひとつの動画に付けられるコメントの数は多いが、コメント1件の長さには大きな差はない。

もしどの動画に対しても似たようなコメントが付けられていれば、discriminating powerが低い、つまり検索に有用ではないことになるが、コメントの総単語数が250以上付いている動画に関しては、タイトルや説明文を使用するよりもdiscriminating powerが高いことがわかった。

実験

検索に使用するクエリは動画のタグから選択。評価指標にはMRRを使用。タイトルと説明文のみ使用する手法と、タイトル、説明文、コメントを使用する手法を比較したところ、後者の方が平均のMRRは高い結果となった。また、popな動画セットほど大幅な改善が見られた。
コメントは、全て使用するのではなく、既存手法を使って、KLダイバージェンスへの寄与率の高い単語だけを使うように枝刈りをした方が、より精度が改善された。


-その他, 論文紹介

関連記事

Struggling or Exploring? Disambiguating Search Sessions

Ahmed Hassan Ryen W. White Susan Dumais Yi-Min Wang In Proc. of WSDM2014 概要 長い検索セッションには,ユーザが情報の探索をして …

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew Dominowska, Ewa Ragno, Robert In Proc. of WWW2007 概要 検索結果の横に表示される広告のCTRの推定を目的として …

Search engine click spam detection based on bipartite graph propagation

Li, Xin Zhang, Min Liu, Yiqun Ma, Shaoping Jin, Yijiang Ru, Liyun In Proc. of WSDM 2014 http://dl.ac …

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel Hiemstra, Djoerd In Proc. of ECIR2008 http://dl.acm.org/citation.cfm?id=1793313 概要 …

Good Abandonment in Mobile and PC Internet Search

Li, Jane Huffman, Scott Tokuda, Akihito In Proc of SIGIR2009 http://dl.acm.org/citation.cfm?id=15719 …