Closing the loop: Experimentally validated methods in AI-driven protein design

Closing the loop: Experimentally validated methods in artificial intelligence–driven protein design

Current Opinion in Structural Biology Vol.98 | 2026 | DOI: 10.1016/j.sbi.2026.103272 | Kosonocky, Yang, Alamdari, Amini (Microsoft Research + UT Austin)

AI駆動タンパク質設計を「実験検証済み手法のみ」というフィルタで再整理。構造ベース系と配列LM系の2系統を、バインダー・抗体・酵素の3応用領域で成功率比較。

① 背景と課題

AlphaFold2 以降、生成モデルによる de novo タンパク質設計は爆発的に進展した。RFdiffusion・Chroma・FrameDiff・ESM-2 などモデルアーキテクチャは続々と発表されるが、レビュー論文の多くは 計算ベンチマーク性能の比較 に終始しており、実際にウェットラボで折り畳み・機能を発揮した手法を整理した実践的レビューは存在しなかった。

既存レビューの限界 1: 計算ベンチマーク（pLDDT, scTM など）は wet 成功率と必ずしも相関しない

既存レビューの限界 2: 各論文の実験条件・成功定義・候補選択ロジックがバラバラで、横断比較が事実上不可能

→ 本研究の動機: 「実験で発現・折り畳み・機能が確認された手法のみ」を対象に、データ→モデル→生成→検証のクローズドループとして AI タンパク質設計を再整理する。

② 手法の概要 — End-to-End ループ

③ 本研究で示したこと

構造ベース（骨格生成 → 固定骨格配列設計 → AF2 自己一貫性）と配列ベース（タンパク質LM）の 2 系統 に AI 設計を整理
応用領域を バインダー / 抗体 / 酵素 の 3 つに分け、各領域の代表手法を成功率付きで Tables 1–4 にまとめた
計算ベンチマークでなく 実験的に発現・機能確認できた 手法だけを採録した点が新規
骨格生成と配列設計の 一体化（all-atom 生成） が最新トレンドと指摘
クローズドループの完成にはデータ共有プラットフォームと標準化された成功定義が必要と提言

④(a) 構造ベース vs 配列ベースパイプライン

④(b) 主要モデルの登場時系列

④(c) 応用領域 3 軸の成功率レンジ

④(d) 実験検証ステップ別候補残存ファネル

⑤ テイクホームメッセージ

クローズドループの不在
実験フィードバックを次世代モデルに還元する仕組みが多くの研究で未実装。データ共有と成功定義の標準化が次のフロンティア。

構造ベース 3 段スタック
骨格生成（RFdiffusion）→ 配列設計（ProteinMPNN）→ AF2 自己一貫性が事実上のデファクト。Rosetta による物理ベースのフィルタが上乗せされる。

配列LMの台頭
ESM-2 をベースに酵素ファミリーへファインチューニングすると、構造を経由せず高い活性タンパク質を得られる事例が出ている。

all-atom 生成への収束
骨格と配列を分離せず一体化して全原子を直接生成するモデルが最新トレンドであり、検証段階でのギャップ削減が期待される。

計算化学パイプラインへの応用

lib/docking: AI 設計タンパク質を新規ターゲットとして UniDockRunner にかけ、天然に存在しないポケットへの低分子探索
lib/fep: MMGBSAEngine で AI 設計受容体 × 既知リガンド親和性を予測、設計ポケットのドラッガビリティ評価
lib/molgen: 設計ポケット形状を MolgenYaml の制約として、ポケット適合分子を生成
lib/md: 設計タンパク質の MD で安定性・水和構造を評価、wet 検証前のスクリーニングに利用

インパクト

計算ベンチマークと wet 成功率の乖離を明示し、研究者が手法選択時に参照すべき実用ガイドを提供
3 応用領域 × 2 設計系統のマトリクスで、次に挑戦すべき領域（膜タンパク質・RNA 結合タンパク質）が浮かび上がる
クローズドループのインフラ整備（データ共有・成功定義標準化）に対する研究コミュニティの行動を促す