大規模ゲノム情報解析を加速する並列計算システム
【研究分野】生命・健康・医療情報学
【研究キーワード】
ワークフロー / 再現性 / コンテナ仮想化 / 並列計算 / パイプライン / ゲノム科学 / 並列分散計算 / ハイパフォーマンスコンピューティング / ゲノム解析 / ソフトウエア開発効率化・安定化 / ハイパフォーマンス・コンピューティング / アルゴリズム / ゲノム
【研究成果の概要】
従来から長らく研究されてきた数値計算によるシミュレーション等の並列計算研究では演算器の利用効率が高いことが求められてきた。しかし、自然科学では発見は一度きりであり、ゲノム分野における並列計算では演算の実行よりもプログラムの作成にボトルネックが存在していることが多い。そこで、ゲノム解析に適した「composable なコンテナシステム」「学習量が少なくて済み、記述量も少ないワークフロー記述システム」「商用クラウドやHPCクラスターを便利に使うためのシステム」など、各種のシステムソフトウェアを開発しフリーソフトとして公開した。
【研究の社会的意義】
ゲノム研究など、数多くのグループ・企業が提供しているソフトウェアを組み合わせて大規模データを解析する発見科学の計算を「(速くではなく)早く」実行するシステムにより各種の研究や開発が大きく加速される。ゲノム研究だけではなく、自然言語処理や深層学習を含む機械学習分野でも類似の問題を抱えており、これらの分野でも研究・開発が加速される。
【研究代表者】
【研究種目】若手研究(B)
【研究期間】2016-04-01 - 2019-03-31
【配分額】3,900千円 (直接経費: 3,000千円、間接経費: 900千円)