異質な集団を含むデータに対する統計的学習理論を用いたモデル開発と臨床医学への応用
【研究キーワード】
二値回帰モデル / ROC / IDI / odds-IDI / power-IDI / 集団の異質性 / 解釈可能性 / 混合治癒モデル / 生存時間解析 / 多値応答 / ノンコンプライアンス / 平均因果効果 / pAUC / 反応例解析 / 欠測データ / 医学統計学 / 生物統計 / 機械学習 / 統計科学
【研究成果の概要】
本研究の目的は,異質な部分集団によって構成されるデータに対し,「予測力(説明力)」と「解釈可能性」が両立する統計的方法の構築に寄与することである.本年度は,二値回帰モデルに対する方法論として,(1) power-IDIの問題点を解決する新たな指標,(2) 臨床試験におけるエンドポイントに欠測がある場合の共変量調整によるリスク差の推定法を検討した.
(1)は,新しい共変量を追加することによってモデルの予測性能が改善するかを評価する問題である.この場合にROC曲線の下側面積を比較・評価することが多いが,これは予測量の順序に基づくため検出力が低い.また,Pencina et al. (2008)は感度と特異度の積分値に基づくIDI(integrated discriminant index)を提案したが,過剰な誤検出の可能性が様々な文献で指摘されている.そこで,応答の予測確率のオッズに基づく,上記に代わる新しい指標を構築・提案した.提案する指標はFisher一致性を備えており,過去に提案した指標(Hayashi and Eguchi, 2019)の解釈の難しさやハイパーパラメータの設定という問題を克服している.
(2)は,無作為化比較試験において二値変数のアウトカムに欠測が生じる状況を考える.Mukaka et al. (2016)は完全ケース解析(complete case analysis)と欠測値の多重代入法(multiple imputation method)を比較しているが,主要な推定対象であるリスク差の一致推定にはそれぞれ制約の強い仮定が要求される.これを踏まえ,Van Lanker et al. (2020)の方法に基づき,欠測値の存在下で共変量を用いたリスク差の推定方法を検討した.
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2018-04-01 - 2023-03-31
【配分額】4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)