投稿日: その他 論文紹介

Modeling documents as mixtures of persons for expert finding

Serdyukov, Pavel
Hiemstra, Djoerd
In Proc. of ECIR2008
http://dl.acm.org/citation.cfm?id=1793313

概要

ユーザが入力したクエリに関する専門家の発見を目的とした論文。専門家の候補は与えられており、クエリに関して専門度の高い順に専門家がランキングされてユーザに提示される。

モデル

専門家をe、クエリ内の単語をq_{1},\cdots ,q_{k}としたときに、P(e,q_{1},\cdots ,q_{k})の値が大きい専門家を求めることが目的。従来モデルでは以下のように専門家と文書内の単語が切り離されていた。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(D)P(e|D) \prod_{i=1}^{k}P(q_{i}|D)
これに対して提案モデルでは、以下のように専門家が単語を生成する。
 P(e,q_{1},\cdots ,q_{k})=\sum_{D \in R} P(q_{1},\cdots ,q_{k}|e)P(e|D)P(D)
1つの文書内の各単語は、その文書内に名前やメールアドレスのある複数の専門家の影響を受けて生成されていると考える。つまり、各専門家の語生成モデルの重ねあわせを考える。
この考えに基づき、P(w|e)およびP(e|D)をEMアルゴリズムにより求める。

P(e)=\sum_{D\in R}P(e|D)P(D)であるので、P(e)=1/専門家の総数、とするシンプルな方法もあるが、実験の結果はP(e|D)を計算した方が高精度であった。


-その他, 論文紹介

関連記事

Semantic Annotation of Mobility Data using Social Media

Wu, Fei and Li, Zhenhui and Lee, Wang-Chien and Wang, Hongjian and Huang, Zhuojie In Proc. of WWW 20 …

Are Web User Comments Useful for Search?

Wai Gen Yee Andrew Yates Shizhu Liu Ophir Frieder In Proc. of LSDS-IR Workshop 2009 概要 YouTubeの動画を検索 …

Adaptive Query Suggestion for Difficult Queries

Liu, Yang Song, Ruihua Chen, Yu Nie, Jian-Yun Wen, Ji-Rong In Proc. of SIGIR 2012 http://dl.acm.org/ …

Mining long-term search history to improve search accuracy

Tan, Bin Shen, Xuehua Zhai, ChengXiang In Proc. of KDD2006 http://dl.acm.org/citation.cfm?id=1150493 …

Predicting the popularity of web 2.0 items based on user comments

He, Xiangnan and Gao, Ming and Kan, Min-Yen and Liu, Yiqun and Sugiyama, Kazunari In Proc. of SIGIR …