大規模SNS上の話題の構造化による集合行動解析手法
【研究キーワード】
ソーシャルメディア / データマイニング / ビッグデータ解析 / 集合行動 / 多様性評価 / 多様性 / 反応分析 / 話題抽出
【研究成果の概要】
1. Two-Stage Clustering 手法の開発
2021年度は、SNSにおける人々の反応を分析するために、マイクロクラスタリングと時系列クラスタリングを組み合わせた Two-Stage Clustering 手法を提案し、コロナワクチンに対するTwitterデータ(全量データ)の分析を行った。この手法は、これまで内容の類似度に加えて、時系列上のパターン類似度を考慮できる効率的な手法であり、これにより、コロナワクチンに関する12M以上のTweet集合を、速報ニュースへの反応、Tweetへの反応、その他(デマなど)に分類できることを示した。結果を論文としてまとめ、BigData2021にも採択された。また招待講演等でも紹介を行った。
2. コロナワクチンに関する人々の反応評価(時系列分析)
さらにTwitterの全量データを対象として、コロナワクチンに対する人々の反応のセンチメント分析(時系列評価)にも取り組んでおり、コロナワクチンに対する日本国民の気持ちが時間とともにどのような変遷をたどったかについて考察している。結果は、近日中に社会科学系のジャーナルに投稿予定である。
3. マイクロクラスタリング手法の改良
大規模データに対応可能とするために、マイクロクラスタリング手法を、より類似度の高いインスタンスを初期のタイミングで集約する改良を行った。これにより、数千万件規模のTwitterデータが標準的なPC上でリーズナブルな速度で分析可能となった。大規模データ分析において、極めて重要な成果であると認識している。
【研究代表者】