投稿日: その他 論文紹介

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel
Hiemstra, Djoerd
In Proc. of ECIR2008
http://dl.acm.org/citation.cfm?id=1793313

概要

ユーザが入力したクエリに関する専門家の発見を目的とした論文。専門家の候補は与えられており、クエリに関して専門度の高い順に専門家がランキングされてユーザに提示される。

モデル

専門家をe、クエリ内の単語をq_{1},\cdots ,q_{k}としたときに、P(e,q_{1},\cdots ,q_{k})の値が大きい専門家を求めることが目的。従来モデルでは以下のように専門家と文書内の単語が切り離されていた。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(D)P(e|D) \prod_{i=1}^{k}P(q_{i}|D)
これに対して提案モデルでは、以下のように専門家が単語を生成する。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(q_{1},\cdots ,q_{k}|e)P(e|D)P(D)
1つの文書内の各単語は、その文書内に名前やメールアドレスのある複数の専門家の影響を受けて生成されていると考える。つまり、各専門家の語生成モデルの重ねあわせを考える。
この考えに基づき、P(w|e)およびP(e|D)をEMアルゴリズムにより求める。

P(e)=\sum_{D\in R}P(e|D)P(D)であるので、P(e)=1/専門家の総数、とするシンプルな方法もあるが、実験の結果はP(e|D)を計算した方が高精度であった。


-その他, 論文紹介

関連記事

Spatial influence vs. community influence: modeling the global spread of social media

Kamath, Krishna Y. Caverlee, James Cheng, Zhiyuan Sui, Daniel Z. In Proc. of CIKM 2012 http://dl.acm …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Tagging Your Tweets: A Probabilistic Modeling of Hashtag Annotation in Twitter

Ma, Zongyang Sun, Aixin Yuan, Quan Cong, Gao In Proc. of CIKM2014 http://dl.acm.org/citation.cfm?id= …

Statistical Models of Music-listening Sessions in Social Media

Zheleva, Elena and Guiver, John and Mendes Rodrigues, Eduarda and Milić-Frayling, Nataša In Proc. of …

Optimizing Search by Showing Results In Context

Dumais, Susan Cutrell, Edward Chen, Hao In Proc. of CHI2001 http://dl.acm.org/citation.cfm?id=365116 …