ビッグクエリー×ビッグデータ検索実現のためのSMAD技術の新展開
【研究分野】情報学基礎理論
【研究キーワード】
アルゴリズム理論 / アルゴリズム / バイオインフォマティクス / ビッグデータ / 次世代シークエンサー / 差分プライバシー / 秘匿検索 / 検索技術 / ビッグクエリー / SMAD / SMAD
【研究成果の概要】
爆発的に増加するビッグデータに対応した検索技術が求められている。これに対し、データベースの統計的挙動を活用するSMAD (Statistical Model-based Algorithm Design)技術が注目されている。本研究ではこのSMAD技術をビッグクエリー×ビッグデータ検索へ展開させる研究を行った。特に、個人ゲノムデータベース、タンパク質立体構造データベース、自然言語テキストデータベースなど様々なデータベースに対する大規模検索の基盤技術を開発することに成功したほか、プライバシー保護技術、PCMメモリにおけるメモリ分散技術、次世代シークエンサー解析などの技術開発にも成功した。
【研究の社会的意義】
近年のデータ爆発は、大規模ビッグデータに対する大規模なクエリーを著しく困難にしており、それに対する超効率な検索基盤技術の開発が求められている。本研究では、SMAD技術を核に、ゲノムデータベース、タンパク質立体構造データベース、自然言語テキストデータベースなど様々なデータベースに対する検索技術の開発に成功したほか、プライバシー保護、PCMメモリの活用、次世代シークエンサー解析など、様々なデータ解析の基盤技術の高度化にも貢献することに成功している。これらの技術によって、今後さらにビッグデータの利活用が高度化されることが期待できる。
【研究代表者】
【研究種目】基盤研究(B)
【研究期間】2017-04-01 - 2021-03-31
【配分額】11,570千円 (直接経費: 8,900千円、間接経費: 2,670千円)