投稿日:2012/10/21 更新日: WWW 論文紹介

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor
In Proc. of WWW 2012
http://dl.acm.org/citation.cfm?id=2187939

目的

Yahoo! Answersの過去の質問とベストアンサーを再利用して,未回答の質問に適した回答を発見することが目的.

手法

手法は大きく2つの段階から成る.
まず,未回答の質問と最も類似した過去の質問を見つける.
次に,最も類似した質問に対するベストアンサーが,未回答の質問に対する回答として適切かをSVMにより判定する.

1段階目では,質問のタイトルと本文をもとにTF-IDFベクトルを作り,コサイン類似度により類似度を測っている.

2段階目では,95個の素性を使っているが,有効な素性は論文中で「Query Feedback」と呼ばれるものであった.この素性では,CQA内での検索結果の重複度合いを用いており,例えば未回答の質問をクエリとした検索結果と1段階目で求められた質問をクエリとした検索結果の重複度などがある.

実験

実験では,SVMの教師データ作成にはAmazon Mechanical Turkを使用.交差検定の結果,分類精度は80%程度.
また,新しく投稿された質問に対して提案手法で自動的に回答するロボットを作って実際にYahoo! Answersで回答を投稿してみると,人間が回答するよりも高い確率でベストアンサーに選ばれた.


-WWW, 論文紹介
-

関連記事

Are Web User Comments Useful for Search?

Wai Gen Yee Andrew Yates Shizhu Liu Ophir Frieder In Proc. of LSDS-IR Workshop 2009 概要 YouTubeの動画を検索 …

TwitterRank: Finding Topic-sensitive Influential Twitterers

Weng, Jianshu Lim, Ee-Peng Jiang, Jing He, Qi In Proc. of WSDM 2010 http://dl.acm.org/citation.cfm?i …

Extending Faceted Search to the General Web

Kong, Weize Allan, James In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id=2661964 概要 ファセットを提示す …

Contextual queries express mobile information needs

Hinze, Annika M. Chang, Carole Nichols, David M. In Proc. of MobileHCI 2010 http://dl.acm.org/citati …

Exploring and exploiting user search behavior on mobile and tablet devices to improve search relevance

Song, Yang Ma, Hao Wang, Hongning Wang, Kuansan In Proc. of WWW 2013 http://dl.acm.org/citation.cfm? …