投稿日: その他 論文紹介

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel
Hiemstra, Djoerd
In Proc. of ECIR2008
http://dl.acm.org/citation.cfm?id=1793313

概要

ユーザが入力したクエリに関する専門家の発見を目的とした論文。専門家の候補は与えられており、クエリに関して専門度の高い順に専門家がランキングされてユーザに提示される。

モデル

専門家をe、クエリ内の単語をq_{1},\cdots ,q_{k}としたときに、P(e,q_{1},\cdots ,q_{k})の値が大きい専門家を求めることが目的。従来モデルでは以下のように専門家と文書内の単語が切り離されていた。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(D)P(e|D) \prod_{i=1}^{k}P(q_{i}|D)
これに対して提案モデルでは、以下のように専門家が単語を生成する。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(q_{1},\cdots ,q_{k}|e)P(e|D)P(D)
1つの文書内の各単語は、その文書内に名前やメールアドレスのある複数の専門家の影響を受けて生成されていると考える。つまり、各専門家の語生成モデルの重ねあわせを考える。
この考えに基づき、P(w|e)およびP(e|D)をEMアルゴリズムにより求める。

P(e)=\sum_{D\in R}P(e|D)P(D)であるので、P(e)=1/専門家の総数、とするシンプルな方法もあるが、実験の結果はP(e|D)を計算した方が高精度であった。


-その他, 論文紹介

関連記事

Music on YouTube: User engagement with traditional, user-appropriated and derivative videos

Liikkanen, Lassi A. and Salovaara, Antti In Computers in Human Behavior, vol. 50 概要 YouTubeの音楽動画を対象に …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …

Learning from the Past: Answering New Questions with Past Answers

A. Shtok, G. Dror, Y. Maarek, and I. Szpektor In Proc. of WWW 2012 http://dl.acm.org/citation.cfm?id …

Experiments with a Venue-Centric Model for Personalisedand Time-Aware Venue Suggestion

Deveaud, Romain and Albakour, M-Dyaa and Macdonald, Craig and Ounis, Iadh In Proc. of CIKM 2015 概要 ユ …

Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs

Brody, Samuel Diakopoulos, Nicholas In Proc. of EMNLP2011 http://dl.acm.org/citation.cfm?id=2145498 …