投稿日: WSDM 論文紹介

【論文紹介】Detecting and Characterizing Eating-Disorder Communities on Social Media

Wang, Tao and Brede, Markus and Ianni, Antonella and Mentzakis, Emmanouil
WSDM 2017
ACM, PDF

概要

摂食障害を持つtwitterユーザを対象にして、摂食障害を持たないユーザとの様々な振る舞いの違いを分析した論文。ユーザごとにいくつかの特徴量を求め、摂食障害者か否かを分類するタスクにも取り組んでいる。

データセット

「eating disorder」や「anorexia」といった摂食障害に関するキーワードがTwitterのプロフィールの文中に含まれているユーザを摂食障害者として収集。摂食障害でないユーザとして、全ユーザからランダムに選択したユーザ集合(Random)と、若い女性ユーザ集合(Younger)を収集。Youngerを対象にしたのは、若い女性が摂食障害になりやすいことから。

摂食障害ユーザ分類

以下の3カテゴリの素性を元にSVMで摂食障害ユーザか否かを分類。

  • Social status:フォロワー数、フォロウィー数、ツイート数の総和に基づく素性など。
  • Behavioral patterns:リツイート数、引用数、メンション数など。
  • Psychometric properties:ユーザの過去のツイート集合をひとつの文書とみなし、その中に含まれる単語からLIWC(Linguistic Inquiry and Word Count)を元に80次元のベクトルで表現。

摂食障害ユーザとRandom、摂食障害ユーザとYoungerとの分類精度はいずれも98%程度。

摂食障害ユーザの振る舞い分析

摂食障害ユーザだけを対象にして、フォロー関係、リツイート関係、リプライ関係、メンション関係のそれぞれを元に4種類のグラフを作成。各グラフに対してノード数やedge densityなど9種類の指標を算出。過去の研究で一般ユーザを対象にグラフを作成し、同じ指標で求められた値と比較することで摂食障害ユーザに特有の傾向を分析。
分析の結果、フォロー関係ネットワークからは摂食障害ユーザ同士は一般ユーザにくらべて密につながっていることや、リプライ関係ネットワークからは摂食障害ユーザ同士はより頻繁にコミュニケーションをとっていることなどが明らかになった。

感想

Twitterを対象にして分析すると、色々とデータは得られるだろうが、いかにそれを論文としてまとめるかが難しいところだと思う。明らかになったことを書き連ねていくだけだと、「色々やってるけど何が言いたいのかよく分からない論文」になりかねないので、分析系の論文だとリサーチクエスチョンを明示して、分析結果からリサーチクエスチョンに回答する、という書き方が多い印象がある。その点、この論文ではリサーチクエスチョンが明記されていないにも関わらず「色々やっているだけ感」がなく、真似するのが難しい書き方だと感じた。


-WSDM, 論文紹介

関連記事

Supporting Complex Search Tasks

Ahmed Hassan Awadallah Ryen W. White Patrick Pantel Susan T. Dumais Yi-Min Wang In Proc. of CIKM2014 …

Perception and understanding of social annotations in web search

Fernquist, Jennifer Chi, Ed H. In Proc. of WWW 2013 http://dl.acm.org/citation.cfm?id=2488424 概要 Goo …

Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! using word lengthening to detect sentiment in microblogs

Brody, Samuel Diakopoulos, Nicholas In Proc. of EMNLP2011 http://dl.acm.org/citation.cfm?id=2145498 …

Personalized Diversification of Search Results

D. Vallet and P. Castells In Proc. of SIGIR 2012 http://dl.acm.org/citation.cfm?id=2348396 目的 検索結果の多 …

Analyzing and evaluating query reformulation strategies in web search logs

Huang, Jeff Efthimiadis, Efthimis N. In Proc. of CIKM2009 http://dl.acm.org/citation.cfm?id=1645966 …