投稿日:2012/10/21 更新日: WWW 論文紹介

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor
In Proc. of WWW 2012
http://dl.acm.org/citation.cfm?id=2187939

目的

Yahoo! Answersの過去の質問とベストアンサーを再利用して,未回答の質問に適した回答を発見することが目的.

手法

手法は大きく2つの段階から成る.
まず,未回答の質問と最も類似した過去の質問を見つける.
次に,最も類似した質問に対するベストアンサーが,未回答の質問に対する回答として適切かをSVMにより判定する.

1段階目では,質問のタイトルと本文をもとにTF-IDFベクトルを作り,コサイン類似度により類似度を測っている.

2段階目では,95個の素性を使っているが,有効な素性は論文中で「Query Feedback」と呼ばれるものであった.この素性では,CQA内での検索結果の重複度合いを用いており,例えば未回答の質問をクエリとした検索結果と1段階目で求められた質問をクエリとした検索結果の重複度などがある.

実験

実験では,SVMの教師データ作成にはAmazon Mechanical Turkを使用.交差検定の結果,分類精度は80%程度.
また,新しく投稿された質問に対して提案手法で自動的に回答するロボットを作って実際にYahoo! Answersで回答を投稿してみると,人間が回答するよりも高い確率でベストアンサーに選ばれた.


-WWW, 論文紹介
-

関連記事

Bad News Travel Fast: A Content-based Analysis of Interestingness on Twitter

Nasir Naveed Thomas Gottron Jérôme Kunegis Arifah Che Alhadi In Proc. of WebSci 2011 http://dl.acm.o …

Placing Videos on a Semantic Hierarchy for Search Result Navigation

Tan, Song Jiang, Yu-Gang Ngo, Chong-Wah ACM TOMM 2014 http://dl.acm.org/citation.cfm?id=2578394 概要 「 …

Who Will You “@”?

Gong, Yeyun and Zhang, Qi and Sun, Xuyang and Huang, Xuanjing In Proc. of CIKM 2015 概要 Twitterではリプライ …

Spatial influence vs. community influence: modeling the global spread of social media

Kamath, Krishna Y. Caverlee, James Cheng, Zhiyuan Sui, Daniel Z. In Proc. of CIKM 2012 http://dl.acm …

Using information scent and need for cognition to understand online search behavior

Wu, Wan-Ching Kelly, Diane Sud, Avneesh In Proc. of SIGIR2014 http://dl.acm.org/citation.cfm?id=2609 …