❏歴史ビッグデータ研究基盤による過去世界のデータ駆動型復元と統合解析(19H01141)
【研究テーマ】
【研究種目】基盤研究(A)
【研究期間】2019-04-01 - 2022-03-31
【研究代表者】北本 朝展 国立情報学研究所, コンテンツ科学研究系, 教授 (00300707)
【キーワード】歴史ビッグデータ / データ構造化 / エンティティ / 識別子 / 歴史GIS (他11件)
【概要】「歴史ビッグデータ」という新しい研究分野を確立するための基礎的な研究を進めるとともに、歴史ビッグデータの構築を推進する研究基盤を公開した。まず、歴史ビッグデータ構築の参照モデルとなるよう、データ構造化ワークフローのモデル化に取り組み、文書空間と実体空間を双方向的に結合する新しいモデルを提案した。次に、実体空間の構造化となるエンティティデータベースの拡充を進め、現代から過去に至る様々な粒度の地名に識...
❏リアルタイムMRIおよびWAVEデータによる調音音声学の精緻化(17H02339)
【研究テーマ】言語学
【研究種目】基盤研究(B)
【研究期間】2017-04-01 - 2020-03-31
【研究代表者】前川 喜久雄 大学共同利用機関法人人間文化研究機構国立国語研究所, 音声言語研究領域, 教授 (20173693)
【キーワード】調音音声学 / 音声生成 / リアルタイムMRI / 日本語 / モンゴル語 (他15件)
【概要】東京方言16名分、近畿方言5名分、モンゴル語3名の調音運動を記録したリアルタイムMRI動画を1名あたり約1時間収集した。データのブラウジング環境を構築し、音声器官(舌、唇、口蓋、咽頭壁など)の輪郭を自動抽出する技術を開発した。このデータを利用して、①モンゴル語母音調和に関する舌根位置の関与を示した論文、②日本語発話末に生じる撥音の調音位置が直前母音によって決まっていることを示した論文、③日本語ワ行...
❏言語理解における人間の振舞いの分析と言語処理の高精度化への応用(16H02865)
【研究テーマ】知能情報学
【研究種目】基盤研究(B)
【研究期間】2016-04-01 - 2019-03-31
【研究代表者】徳永 健伸 東京工業大学, 情報理工学院, 教授 (20197875)
【キーワード】自然言語処理 / コーパス / アノテーション / 視線情報 / 振舞い情報 (他9件)
【概要】自然言語処理の分野では,単語の品詞など,解析結果として得たい正解を解析対象のテキストに人手で付与(アノテーション)した「コーパス」を構築し,それを機械学習の訓練データとして用いることによって問題を解く手法が主流である.自然言語処理の広範な課題を網羅するために,自然言語処理の課題をセグメント課題,リンク課題,変換課題に分類し,各タイプの課題においてアノテーション作業者の視線,キー入力,マウス操作など...