投稿日:2012/10/21 更新日: WWW 論文紹介

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor
In Proc. of WWW 2012
http://dl.acm.org/citation.cfm?id=2187939

目的

Yahoo! Answersの過去の質問とベストアンサーを再利用して,未回答の質問に適した回答を発見することが目的.

手法

手法は大きく2つの段階から成る.
まず,未回答の質問と最も類似した過去の質問を見つける.
次に,最も類似した質問に対するベストアンサーが,未回答の質問に対する回答として適切かをSVMにより判定する.

1段階目では,質問のタイトルと本文をもとにTF-IDFベクトルを作り,コサイン類似度により類似度を測っている.

2段階目では,95個の素性を使っているが,有効な素性は論文中で「Query Feedback」と呼ばれるものであった.この素性では,CQA内での検索結果の重複度合いを用いており,例えば未回答の質問をクエリとした検索結果と1段階目で求められた質問をクエリとした検索結果の重複度などがある.

実験

実験では,SVMの教師データ作成にはAmazon Mechanical Turkを使用.交差検定の結果,分類精度は80%程度.
また,新しく投稿された質問に対して提案手法で自動的に回答するロボットを作って実際にYahoo! Answersで回答を投稿してみると,人間が回答するよりも高い確率でベストアンサーに選ばれた.


-WWW, 論文紹介
-

関連記事

Personalized Models of Search Satisfaction

Ahmed Hassan Ryen W. White In Proc. of CIKM 2013 概要 ユーザが検索セッションに対して満足したか,不満足だったかを知ることは検索エンジンの質を高めるうえ …

【論文紹介】What Makes a Link Successful on Wikipedia?

Dimitrov, Dimitar and Singer, Philipp and Lemmerich, Florian and Strohmaier, Markus In Proc. of WWW …

From x-rays to silly putty via Uranus: serendipity and its role in web search

Paul André Jaime Teevan Susan T. Dumais In Proc. of CHI 2009 http://dl.acm.org/citation.cfm?id=15187 …

Deciphering Mobile Search Patterns: A Study of Yahoo! Mobile Search Queries

Yi, Jeonghee Maghoul, Farzin Pedersen, Jan In Proc. of WWW2008 http://dl.acm.org/citation.cfm?id=136 …

Explainable User Clustering in Short Text Streams

Zhao, Yukun and Liang, Shangsong and Ren, Zhaochun and Ma, Jun and Yilmaz, Emine and de Rijke, Maart …