投稿日: WSDM 論文紹介

Identifying topical authorities in microblogs

Pal, Aditya
Counts, Scott
In Proc. of WSDM2011
http://dl.acm.org/citation.cfm?id=1935843

概要

あるキーワードに関してauthority度の高いユーザを発見してユーザに提示することを目的としている。
与えられたキーワードについて言及しているユーザを集めて、ユーザ毎にツイート内容等を元にベクトルを作り、ユーザをauthorityクラスタとnon-authorityクラスタの2つにソフトクラスタリングする。authorityクラスタのユーザの中でベクトルの要素の和が大きいユーザほどauthority度が高いとみなす。

ユーザのベクトル作成

ユーザの全ツイートの中でのリツイートとメンションを除くツイートの割合や、どれだけ多くのユニークユーザにリツイートされたか、フォロワーの中でキーワードについてユーザよりも後に呟いたユーザ数と前に呟いたユーザ数の差などを素性としてユーザごとにベクトルを作成。

ユーザのクラスタリング

上記のベクトルを用いて、混合ガウス分布によりユーザを2つのクラスタにクラスタリング。クラスタリングにはEMアルゴリズムを使用。
各クラスタの所属確率が0.9以上のユーザだけを抽出して、Topical singal、Retweet impact、Mention impactの3つの素性の値の平均値をクラスタごとに計算する。値の大きいクラスタをauthorityの属するクラスタとみなす。
さらに、authorityの属するクラスタの中で、素性の値の和が大きいユーザほどauthority度が高いとみなしてユーザをランキングする。


-WSDM, 論文紹介

関連記事

Semantic Similarity Between Search Engine Queries Using Temporal Correlation

S. Chien, and N. Immorlica In Proc. of WWW 2005 http://dl.acm.org/citation.cfm?id=1060752 目的 クエリログを用 …

Improving relevance judgment of web search results with image excerpts

Li, Zhiwei Shi, Shuming Zhang, Lei In Proc. of WWW2008 http://dl.acm.org/citation.cfm?id=1367497.136 …

Improving passage ranking with user behavior information

Weize Kong Elif Aktolga James Allan In Proc. of CIKM 2013 概要 検索中のユーザの振る舞いを基に検索結果をリランキングする研究はこれまでにも行わ …

TwitterRank: Finding Topic-sensitive Influential Twitterers

Weng, Jianshu Lim, Ee-Peng Jiang, Jing He, Qi In Proc. of WSDM 2010 http://dl.acm.org/citation.cfm?i …

Using preference judgments for novel document retrieval

Chandar, Praveen Carterette, Ben In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348398 概要 …