ビッグデータ駆動型科学のための仮説生成・検証法開発と材料,生物,医療分野での実証
【研究分野】知能情報学
【研究キーワード】
機械学習 / 統計科学 / 材料科学 / 生物化学 / 医療科学 / Post-Selection Inference / 生物科学 / Selective Inference / ビッグ・データ / ビッグデータ
【研究成果の概要】
さまざまな科学研究の分野で研究対象に関する膨大なデータが計測できるようになった.このようなデータに基づいて科学的発見を目指すアプローチはデータ駆動型科学と呼ばれている.データ駆動型科学では,データに基づいて仮説を選択するが,データにとって都合のよい仮説が誤って選択されるリスクがあり,適切に信頼性評価を行わなくてはならない.本研究では,選択的推論と呼ばれる技術を用いて,材料,生物,医療分野におけるデータ駆動型仮説の信頼性評価を行う方法を確立し,その実証を行った.
【研究の社会的意義】
研究対象から得られるデータに基づいて科学的発見を目指すアプローチはデータ駆動型科学と呼ばれ,さまざまな分野で有望視されている.しかしながら,データから仮説を選択する際に選択バイアスが生じてしまい,特に,誤った意思決定が重大なリスクとなる分野においては,データ駆動型仮説の信頼性評価が不可欠である.本研究ではデータ駆動型仮説の信頼性評価を行うための方法論を確立し,これをさまざまな分野で実証した.本研究の成果は健在なデータ駆動型科学の発展に寄与するものである.
【研究代表者】