国・文化は違えど感情パターンは同じ――Twitter分析による人の気分の科学研究
コーネル大学のグループが成果を専門誌で発表コーネル大学の2人の研究者、スコット・ゴールダー(Scott Golder)氏とマイケル・メーシー(Michael Macy)氏を中心としたグループが、そうした学問的な知見の獲得に向けたソーシャル・ネットワークのマイニングの最新例となる研究を行った。両氏のグループは、2年間に84カ国の240万人のユーザーから投稿された5億9,000万件のツイートを分析した。両氏はそのデータから、「文化や言語の違いにかかわらず、人々の日々の気分のサイクルは同様である」という結論を導いている。
両氏のグループの研究成果をまとめた論文「Diurnal and Seasonal Mood Vary with Work, Sleep, and Daylength Across Diverse Cultures」(日中の、および季節的な気分の変化と仕事、睡眠、1日の長さの関係:さまざまな文化の中で)が、Science誌の9月30日号に掲載されている。
この研究は直接の成果をもたらしただけでなく、学術研究が取りうる新しい方向性も提示している。それは、学問的知見の獲得を目指したソーシャル・ネットワーク・マイニングだと、両氏は述べている。
「この論文は、新しい方法による社会科学や行動科学の可能性を示している」とメーシー氏。「デジタル・デバイスを使ったコミュニケーションは世界中で普及が進んでおり、そのおかげで、5年前には思いもよらなかった研究の可能性が開けている」
ゴールダー氏はこう付け加えた。「こうしたTwitterなどによる対話を、ありきたりの役に立たないものと考えるのではなく、われわれは、これらのメッセージはタイムスタンプ付きであり、人々が友人に向けて発信したことが確かであるという点に価値を見いだしている」
両氏のグループは、TwitterのAPIを使ってツイートを収集した。6ノード・クラスタをセットアップしてデータを抽出し、それらはXMLフォーマットで取得され、フラット・ファイルに変換された。さらに、コーネル大学センター・フォー・アドバンスト・コンピューティングで稼働する55ノードの「Hadoop」クラスタを使って、データセットを分析した。
両氏のグループが使った分析ツール「Linguistic Inquiry and Word Count」は、特定の言葉とさまざまなポジティブな(積極的な前向きの)気分とネガティブな(消極的な後ろ向きの)気分を対応づける。例えば、「awesome」(見事な)、「fantastic」(素晴らしい)、「pretty」(きれいな)といった言葉を含むツイートは、ポジティブな気分を表していると判断される。また、「remorse」(後悔)、「abandonment」(断念)、「fear」(恐怖)、「fury」(激怒)といった言葉は、ネガティブな気分を表していると判断される。
ツイートの分析結果は、人々が多くの場合、朝や週末に快活であることを示した。朝起きたときは気分が良いが、1日が進むとともに徐々に機嫌が悪くなっていき、夕方になるとまた立ち直るという。平日と週末の両方でこのパターンをたどるが、週末は通常、平日より2時間程度遅くツイートの投稿が始まるという。
週末が土曜日と日曜日でない国(例えば、UAEの平日は日曜日から木曜日まで)でも、このパターンは明らかだった。
こうした分析結果は自明なものと思われるかもしれないが、この研究は、こうした行動を実証的に示した初の本格的な研究だと、両氏は強調している。Twitterは、この研究で貴重な役割を果たした。Twitterでは、個人の感情がリアルタイムに形に残るからだと、ゴールダー氏は説明した。
通常、臨床研究は、対象者にラボに出向いてもらい、そこで行動を観察するか、対象者に対して調査を行う。前者は、日常的な行動の研究を行うには不自然な環境であり、後者は、不正確になりやすい対象者の記憶によって制約される。
「また、自分が何を感じているかを意識することが苦手な対象者もいる」とゴールダー氏。「人々が自然な環境の中で自発的に発する言葉にアクセスできることは、大きなメリットになる」
NSF(米国立科学財団)の資金援助を受けてこの研究を行ったグループは、メーシー氏が率いた。このグループは、コンピュータ支援による社会科学研究プロジェクトに取り組む社会学者とコンピュータ科学者で構成されている。ゴールダー氏は言語学とコンピュータ科学の専門家で、コーネル大学に所属する前は、Hewlett-Packard(HP)でリサーチ・サイエンティストとして働いていた。
「このプロジェクトでは、かなりのエンジニアリング・ノウハウが必要になった。実証的な社会科学では、このノウハウはますます重要になっていくはずだ」(ゴールダー氏)
人々のオンラインでの書き込みを定量分析することで、人間行動を分析する新しい手法については、取り組んでいる組織がほかにもある。米国Google Labsは2010年に、Googleがデジタル化した膨大な書籍を対象に、研究者が計量テキスト分析を行えるテキスト分析ツール「NGram Viewer」をリリースした。
Googleは今週、このツールを「Google Books」サービスに直接統合した。
Twitterも今週、ストリーム処理エンジン「Storm」のソースコードを公開した。Stormは、研究者などのユーザーが、更新されていく多数のTwitterフィードをリアルタイムに分析できるデータ分析ソフトウェア。
(Joab Jackson/IDG News Serviceニューヨーク支局)



























