経済シナリオ分析のための因果関係インスタンス認識技術の確立
【研究キーワード】
因果関係インスタンス / 事前学習モデル / グラフニューラルネットワーク / テキストマイニング / 因果関係 / 因果関係インスタンス認識 / 社会イベント分析
【研究成果の概要】
本年度は、まず、因果関係インスタンスを取得するために、決算短信に対してタグ付与を行った。その後、タグ付けを行った決算短信データ、タグ付与済みの英語ロイターニュース記事、FinCausalのデータセットを用いて実験を行い、日英の文書から因果関係インスタンスを抽出できる手法の開発に取り組んだ。結果的に、BERTとグラフニューラルネットワークを組み合わせることで既存の手法よりも高い精度で因果関係インスタンスを抽出できる手法の開発に成功した。具体的には、全てのデータセットにおいて、F値が0.75以上で因果関係インスタンスを抽出することができた。この結果を論文としてまとめて国際会議に投稿したが、残念ながら不採録となった。そのため、2022年度は論文のブラッシュアップを行い、再度、投稿を行う。
因果関係インスタンスを抽出するためにドメイン特化のBERTモデルの構築も行った。モデル
構築にあたり、グラフィックカードであるNvidiaのV100を購入予定であったが、V100よりも価格が安いうえに性能が高いNvidiaのA6000が発売されていたことから、こちらを2個購入し、モデル構築や実験に利用した。
作成した事前学習モデルは、Web上で公開しており、誰でも無料で利用可能となっている。全ての公開したモデルのダウンロード数を合わせると、現時点で6,700件以上あり、多くの方に利用して頂いている。こちらの研究に関しては、SIGFINなどの国内研究会で発表済みである。こちらの研究に関しては、SIGFINなどの国内研究会で発表済みである。
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2021-04-01 - 2024-03-31
【配分額】3,770千円 (直接経費: 2,900千円、間接経費: 870千円)