統計モデルによるゲノムワイドな遺伝子転写カスケード解析法の開発
【研究分野】生命・健康・医療情報学
【研究キーワード】
転写制御 / 転写因子 / エンハンサー / クロマチン相互作用 / インシュレータ / 遺伝子発現 / ヒストン修飾・オープンクロマチン / 深層学習 / CTCF / オープンクロマチン / エピゲノム / エンハンサープロモーター相互作用 / 機能エンリッチメント / 遺伝子 / 発現制御 / ゲノム / 情報工学
【研究成果の概要】
ゲノムワイドな遺伝子転写カスケードの解析のために、遺伝子の転写開始点から離れた位置(遠位)のDNAに結合する、転写因子が発現を制御する遺伝子(転写標的遺伝子)を予測する手法を開発した。転写標的遺伝子の予測のために、転写因子のDNA結合の位置と遺伝子の転写開始点の対応関係の基準を評価するための指標を見出した。同じ転写因子の転写標的遺伝子には、似た機能をもつ遺伝子が多く含まれ、遺伝子機能の数を転写標的遺伝子の延数で正規化した値が大きいほど、正しく予測された転写標的遺伝子を多く含み、対応関係の基準を評価する指標となった。より良い対応基準を見出し、転写因子と転写標的遺伝子の相互作用を遮蔽して制御するインシュレータ機能に関わる転写因子CTCFのDNA結合の位置を考慮した対応基準では、さらに良い予測結果が得られた。別の指標として、同じ転写因子の転写標的遺伝子の発現量の中央値を見出した。分化成熟した免疫細胞では、転写因子の転写標的遺伝子の発現量の中央値の分布が大きいほど、正しく予測された転写標的遺伝子を多く含み、ESやiPS細胞の幹細胞では、中央値の分布が小さくなる傾向が示された。この結果は、幹細胞では遠位に結合する転写因子が遺伝子発現の抑制として、免疫細胞では活性として機能する傾向を示唆した。
CTCF以外のインシュレータ機能に関わる転写因子を探索する手法を開発した。転写標的遺伝子の対応基準の解析と統計検定を用いた手法を開発し、さらに深層学習を用いた手法で、より正確な予測を行い、既知の転写因子を含む98の転写因子を予測し、そのうち23の転写因子について、論文を調べ、インシュレータ機能に関わる報告を見つけた。大部分はCTCFのインシュレータ機能と関わる転写因子であった。特に転写因子MAZについて、2021年にCTCFと独立してインシュレータ機能をもつことも実験により示された。
【研究代表者】
【研究種目】基盤研究(C)
【研究期間】2016-04-01 - 2023-03-31
【配分額】4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)