投稿日: その他 論文紹介

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel
Hiemstra, Djoerd
In Proc. of ECIR2008
http://dl.acm.org/citation.cfm?id=1793313

概要

ユーザが入力したクエリに関する専門家の発見を目的とした論文。専門家の候補は与えられており、クエリに関して専門度の高い順に専門家がランキングされてユーザに提示される。

モデル

専門家をe、クエリ内の単語をq_{1},\cdots ,q_{k}としたときに、P(e,q_{1},\cdots ,q_{k})の値が大きい専門家を求めることが目的。従来モデルでは以下のように専門家と文書内の単語が切り離されていた。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(D)P(e|D) \prod_{i=1}^{k}P(q_{i}|D)
これに対して提案モデルでは、以下のように専門家が単語を生成する。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(q_{1},\cdots ,q_{k}|e)P(e|D)P(D)
1つの文書内の各単語は、その文書内に名前やメールアドレスのある複数の専門家の影響を受けて生成されていると考える。つまり、各専門家の語生成モデルの重ねあわせを考える。
この考えに基づき、P(w|e)およびP(e|D)をEMアルゴリズムにより求める。

P(e)=\sum_{D\in R}P(e|D)P(D)であるので、P(e)=1/専門家の総数、とするシンプルな方法もあるが、実験の結果はP(e|D)を計算した方が高精度であった。


-その他, 論文紹介

関連記事

Modelling User Interest for Zero-query Ranking

Liu Yang, Qi Guo, Yang Song, Sha Meng, Milad Shokouhi, Kieran McDonald, and W. Bruce Croft In Proc. …

Identifying breakpoints in public opinion

Akcora, Cuneyt Gurcan Bayir, Murat Ali Demirbas, Murat Ferhatosmanoglu, Hakan In Proc. of SOMA 2010 …

Personalized Models of Search Satisfaction

Ahmed Hassan Ryen W. White In Proc. of CIKM 2013 概要 ユーザが検索セッションに対して満足したか,不満足だったかを知ることは検索エンジンの質を高めるうえ …

Deciphering Mobile Search Patterns: A Study of Yahoo! Mobile Search Queries

Yi, Jeonghee Maghoul, Farzin Pedersen, Jan In Proc. of WWW2008 http://dl.acm.org/citation.cfm?id=136 …

Finding Dimensions for Queries

Z. Dou, S. Hu, Y. Luo, R. Song, and JR. Wen In Proc. of CIKM2011 http://dl.acm.org/citation.cfm?id=2 …