「このタンパク質、もっと大量に発現させたい」
エイジが培養データを見ながら言った。
「じゃあ、プロモーターを最適化しよう」ミハイルが提案した。
「プロモーター?」瀬奈が聞いた。
「遺伝子発現のスイッチだ。転写の開始点を決める」
「どうやって最適化するんですか?」
ミハイルが説明を始めた。「プロモーターは複数の要素から成る」
画面にDNA配列が表示された。
「まず、TATAボックス。RNAポリメラーゼが認識する配列だ」
「TATAAA…」瀬奈が読んだ。
「そう。これがコア要素だ。でも、これだけじゃ発現量は低い」
「他に何が必要?」
「エンハンサーやサイレンサー。転写因子が結合する配列だ」
エイジが補足した。「転写因子は、プロモーターの活性を調節するタンパク質だ」
「活性化する因子と、抑制する因子がある」
瀬奈がノートに書いた。「じゃあ、活性化因子の結合部位を増やせばいい?」
「理論的にはそうだけど、そう単純じゃない」ミハイルが言った。
「なんで?」
「転写因子同士の相互作用、DNA二次構造、ヌクレオソーム配置…全てが影響する」
「複雑すぎる」
「だから、機械学習で予測する」
ミハイルがモデルを見せた。配列から発現量を予測するニューラルネットワーク。
「このモデルを使って、高発現プロモーターを設計する」
「どうやって?」
「逆問題として解く。目標発現量を設定して、それを達成する配列を探索する」
エイジが興味を示した。「最適化アルゴリズムは?」
「遺伝的アルゴリズムだ。配列を変異させて、進化させる」
「面白い」
ミハイルが実演した。初期配列を入力。目標発現量を10倍に設定。
「最適化開始」
画面上で配列が変化していく。世代ごとに発現量予測値が上昇する。
「100世代後…」
新しい配列が表示された。
「予測発現量は12倍。目標達成だ」
瀬奈が感心した。「すごい。でも、本当にこの配列で発現量が上がるんですか?」
「予測だから、確証はない。実験で確認する必要がある」
エイジが別の視点を提示した。「組織特異性も考慮すべきじゃない?」
「そうだね。肝臓で高発現させたいのか、脳で高発現させたいのかで、最適なプロモーターが変わる」
「組織特異的転写因子があるからね」
瀬奈が質問した。「じゃあ、モデルは組織ごとに訓練するんですか?」
「理想的にはそう。でも、データが少ない組織もある」
「その場合は?」
「転移学習。豊富なデータがある組織で訓練して、少ないデータの組織にファインチューニングする」
「なるほど」
ミハイルが警告した。「でも、プロモーター設計には制約もある」
「どんな?」
「CpGアイランドを避けるとか。メチル化されやすい配列は発現が抑制される」
「メチル化?」
エイジが説明した。「DNAの化学修飾。エピジェネティック制御の一つだ」
「難しい…」
「だから、多目的最適化になる。発現量を最大化しつつ、CpG含量を抑える」
瀬奈がまとめた。「プロモーター設計は、複数の要因を同時に考える必要があるんですね」
「そう。だから冒険なんだ」ミハイルが微笑んだ。
「冒険?」
「未知の配列空間を探索する。何が見つかるか分からない」
エイジが続けた。「でも、データとモデルがあれば、闇雲な探索よりずっと効率的だ」
「合成生物学の時代だね」
瀬奈が感慨深げに言った。「遺伝子のスイッチを自分でデザインできるなんて」
「でも、責任も伴う」ミハイルが真剣になった。
「責任?」
「設計した配列が、予期しない影響を与える可能性もある。オフターゲット発現とか」
「だから、慎重に設計して、徹底的に検証する」
エイジが頷いた。「強力な技術ほど、慎重に扱わないと」
ミハイルが締めくくった。「DNAプロモーター最適化は、科学と工学の融合だ」
「そして、冒険だ」瀬奈がつぶやいた。
プロモーターという小さな配列。でも、それが生命の発現を大きく左右する。その設計は、まさに冒険だ。