社会調査の基盤を提供する自動コーディングシステムのWeb提供:その国際化と汎用化
【研究分野】社会学
【研究キーワード】
社会調査 / 自由回答 / 職業/産業コーディング自動化システム / SSM/ISCO/ISIC / Web公開システム / 機械学習 / 自然言語処理 / 確信度 / 職業・産業コーディング自動化システム / ルールベース手法と機械学習の組み合わせ手法 / 国内/国際標準職業コード / 国内/国際標準産業コード / Webによる一般公開 / コーディング自動化システム / 職業/産業コーディング / ISCO/ISIC / Web利用システム
【研究成果の概要】
社会調査において自由回答で収集された職業データを自然言語処理や機械学習の適用により国内/国際標準コードに自動的に変換し、その結果に人間が見直す必要性を確信度として付与するシステムを開発した。本研究ではこれをさらに発展させ、産業データの国内/国際標準コードへの自動変換、国内標準コード付きの事例に国際標準コード付与、システムメンテナンスの自動化機能を追加した。平成25年秋以降、東大社会科学研究所(CSRDA)のWebから試供提供され、利用者は入力ファイルをアップロードすれば希望するコードの結果ファイルをダウンロードできる。現在、カテゴリをもつ自由回答のコーディング自動化システムに拡張中である。
【研究代表者】
【研究分担者】 |
多喜 弘文 | 法政大学 | 社会学部 | 講師 | (Kakenデータベース) |
田辺 俊介 | 早稲田大学 | 文学学術院 | 准教授 | (Kakenデータベース) |
|
【研究協力者】 |
李 偉 | 東京工業大学 | 大学院理工学研究科 | 博士課程在学 |
|
【研究種目】基盤研究(C)
【研究期間】2013-04-01 - 2016-03-31
【配分額】4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)