投稿日: その他 論文紹介

Happy, Nervous or Surprised? Classification of Human Affective States in Social Media

Munmun De Choudhury
Michael Gamon
Scott Counts
In Proc. of ICWSM 2012

概要

ツイートを11種類の感情に分類することを目的とした論文。

感情情報の取得

ANEWやLIWCなどから、感情語の候補となる語を収集し、それぞれの語が感情を表しているかどうかをクラウドソーシングで調べ、172の感情語を取得。
分類の対象とする感情として、PANAS-Xで定義された11種類(fear、sadness、guilt、hostility、joviality、self assurance、attentiveness、shyness、fatigue、surprise、serenity)を使用。先ほどの172語が11種類のどれに対応するかをクラウドソーシングでラベル付け。jovialityやsadness、fatigueに属する語が多い。

ツイートの感情の分類

分類に使用するデータとして、ツイートの最後に172語のいずれかをハッシュタグとして持つ680万ツイートを収集。各ツイートをユニグラムとバイグラムを要素とするベクトルで表し、交差検定を用いてロジスティック回帰で各ツイートが11種類の感情のどれに属するかを分類。
分類の結果、jovialityやfatigueのように、対応する語が多い感情ほど、教師データの数が多くなるため、分類精度が高い傾向にあった。


-その他, 論文紹介

関連記事

What’s in a hashtag?: content based prediction of the spread of ideas in microblogging communities

sur, Oren Rappoport, Ari In Proc. of WSDM 2012 http://dl.acm.org/citation.cfm?id=2124320 概要 ツイッター上で、 …

Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs

Brody, Samuel Diakopoulos, Nicholas In Proc. of EMNLP2011 http://dl.acm.org/citation.cfm?id=2145498 …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …

Enhancing collaborative filtering systems with personality information

Hu, Rong and Pu, Pearl In Proc. of RecSys 2011 概要 協調フィルタリングを用いてあるユーザに推薦するアイテムを決める際、通常はそのユーザの過去のアイテムの …

Information Credibility on Twitter

Castillo, Carlos Mendoza, Marcelo Poblete, Barbara In Proc. of WWW 2011 http://dl.acm.org/citation.c …