投稿日: その他 論文紹介

Emotional Divergence Influences Information Spreading in Twitter

Rene Pfitzner
Antonios Garas
Frank Schweitzer
In Proc. of ICWSM 2012

概要

ツイッターでリツイートされやすいツイートの性質を、ツイートのセンチメントという観点から分析。

ツイートのセンチメント分析

SentiStrengthと呼ばれるツールを使用してツイートのセンチメントを分析。このツールでは、単語のポジティブ度合い、ネガティブ度合いをそれぞれ5段階で判定する。ポジティブは1~5、ネガティブは-1~-5。ツイート内にポジティブな単語が複数個ある場合、ポジティブスコアの最大値をそのツイートのポジティブスコア(p)とする。ネガティブは最小値がツイートのネガティブスコア(n)となる。
pnのスコアに応じて、ツイートをポジティブ(|p|>|n|)、ネガティブ(|p|<|n|)、ニュートラル(|p|=|n|)の3種類に分類。

ツイートのポジネガとリツイートの関係

リツイートされていないツイートのネガティブ、ニュートラル、ポジティブの割合は19.9%、33.8%、46.3%であるのに対して、リツイートされたツイートのそれは19.8%、31.4%、48.8%と大きな差はなかった。これより、ツイートのネガポジはリツイートされやすさには影響がないことがわかった。

ツイートのポジネガの振れ幅とリツイートの関係

ツイートのネガポジの振れ幅をp-n/10で定義。たとえば「I love hating you」というツイートに対して、love=3、hate=-4とSentiStrengthによってスコア付けされた場合、ネガポジの振れ幅は0.7となる。振れ幅は0.2~1の値をとるので、このツイートの振れ幅は大きい。

ネガポジの振れ幅とリツイートのされやすさの関係を調べたところ、振れ幅が0.5以上の場合、リツイートされる確率はリツイートされない確率を上回り、振れ幅が0.9のとき確率は最大となる。


-その他, 論文紹介

関連記事

Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs

Brody, Samuel Diakopoulos, Nicholas In Proc. of EMNLP2011 http://dl.acm.org/citation.cfm?id=2145498 …

A comparison of visual and textual page previews in judging the helpfulness of web pages

Aula, Anne Khan, Rehan M. Guan, Zhiwei Fontes, Paul Hong, Peter In Proc. of WWW2010 http://dl.acm.or …

Toward self-correcting search engines: using underperforming queries to improve search

Hassan, Ahmed White, Ryen W. Wang, Yi-Min In Proc. of SIGIR 2013 http://dl.acm.org/citation.cfm?id=2 …

Semantic Annotation of Mobility Data using Social Media

Wu, Fei and Li, Zhenhui and Lee, Wang-Chien and Wang, Hongjian and Huang, Zhuojie In Proc. of WWW 20 …

It Is Not Just What We Say, But How We Say Them: LDA-based Behavior-Topic Model

Qiu, Minghui and Zhu, Feida and Jiang, Jing In Proc. of SDM 2013 概要 トピックモデルを用いて文書の生成過程をモデル化する際、通常は文書 …