患者レジストリを二次利用した潜在的患者ニーズの自動抽出方法の検討
【研究キーワード】
患者市民参画 / 潜在ニーズ / 機械学習 / 患者レジストリ / リアルワールドデータ / 臨床研究 / 人工知能 / 機械学習モデル
【研究成果の概要】
本研究の目的は、患者やその家族の潜在的なニーズを踏まえた国内型の患者参画型研究を推進するため、患者団体等が自ら作成した患者レジストリから潜在ニーズを自動抽出するための手法を検討することである。
【研究計画】(1) 患者レジストリの登録患者対象に治療内容、日常ケアや薬に対するニーズを質的に分析した後、政策や医薬品開発に反映可能なボイスの種類及びその特徴把握。(2) 患者レジストリデータ用いて、タグ付きニーズを正解付きデータとし、治療内容等に対するニーズをクラス分類するための機械学習の予測モデル構築。(3) 治療内容等に対するニーズに加え、患者の個人特性を考慮した予測モデル構築。
【研究成果】2020年度は、患者レジストリより自由回答の内容をコーディング及びカテゴリ化した後、タグ付きニーズとして辞書化を行った。2021年度は潜在ニーズ自動抽出のための機械学習モデルの構築を行った。モデル構築にあたり、次の3点の検討を行った。[1] 特徴量のスケーリング方法。[2] Word2Vecモデルを用いて同義語辞書を作成し、この辞書を使用して同一の特徴量に変換した学習方法。[3] 予測後の潜在ニーズの可視化手法。
【研究代表者】
種村 菜奈枝 国立研究開発法人医薬基盤・健康・栄養研究所 国立健康・栄養研究所 食品保健機能研究部 室長
(Kakenデータベース)