Machine Learning, Docking, or Physics for Structure Prediction of Ligand-induced Ternary Complexes
Solazzo, Chen, Riniker (ETH Zurich) | Curr Opin Struct Biol 97:103217 | 2026年1月 | DOI: 10.1016/j.sbi.2025.103217
PROTAC・分子グルーが作る三元複合体(POI-linker-E3)の構造予測を、多段ドッキングと AlphaFold-Multimer / Boltz-2 系 cofolding で比較整理した最新レビュー。
背景と課題:三元複合体予測がなぜ難しいか

PROTAC・分子グルーは E3 リガーゼと標的タンパク(POI)を強制的に近接させ、ユビキチン化と分解を誘導する分解誘導薬。創薬上の関心は急速に拡大しているが、計算による三元複合体(POI-リンカー-E3)構造予測は古典的なタンパク質-リガンド・ドッキングと比較して根本的に困難である。

三体相互作用(POI / リンカー / E3)を同時に最適化する必要があり、サーチ空間が組み合わせ的に爆発する。
PDB に収録された三元複合体構造は数百件オーダーと少なく、深層学習モデルの訓練データが慢性的に不足。
協同性パラメータ α(cooperativity:三元複合体の協同的安定化度合い)の定量予測は依然未解決。

→ 多段ドッキング・cofolding・物理化学計算という3つのファミリーを横並びで比較し、何が解け、何が残るかを 2024-2026 年の最新研究で再評価することが本レビューの動機。

手法の整理:3つのファミリー
  • マルチステップ・ドッキング:POI 側へのワーヘッド配置 → リンカー探索 → E3 側ドッキング → PPI 最適化(PRosettaC, COMPer)
  • シングルステップ cofolding:AlphaFold-Multimer / Chai-1 / Boltz-2 が POI+E3+リガンドを一括フォールディング
  • 物理化学評価:MM-GBSA / FEP で ΔGternary = ΔGPOI + ΔGE3 − ΔGcoop を評価
マルチステップ・パイプライン POI へ warhead dock linker conf. search E3 へ ligand dock PPI 最適化 (Rosetta) シングルステップ cofolding POI + E3 + ligand 三元複合体 構造 AF-Multimer / Chai-1 / Boltz-2 物理化学評価 ΔG_ternary = ΔG_POI + ΔG_E3 − ΔG_coop MM-GBSA / FEP(最高精度・最高コスト)
本レビューが示したこと
  • 2020 年の Drummond 等のレビュー以降、cofolding モデル登場で景色が一変したことを最新文献で更新
  • 多段法は精度コントロールしやすいが、サンプリング複雑性とスコアリング精度がボトルネック
  • cofolding は速度面で圧倒的だが、訓練データ ~数百件 の壁が汎化を制約
  • 協同性 α の定量予測はどの手法も未解決で、最重要のオープン課題
  • 多段+cofolding+FEP のハイブリッド評価が現実解として提案されている
(a) 手法ファミリー別 ポーズ予測の傾向
三元複合体 ポーズ予測 RMSD(概念図) RMSD (Å) 0 2 4 6 8 10 success ≤4 Å PRosettaC multi-step ~5.5 COMPer multi-step ~5.0 AF-Multimer cofolding ~7.5 Chai-1 cofolding ~6.0 Boltz-2 cofolding ~5.5 +FEP rerank hybrid ~3.8

レビュー本文の引用文献から読み取れる定性的な傾向。多段法と cofolding は同程度の RMSD レンジに収まりつつあり、物理化学リランクで 4 Å を切る ケースが報告される。

(b) PDB 訓練データのスケール感
PDB データ階層(cofolding 訓練の上限) 全タンパク質構造 ~220,000 件 タンパク質-リガンド複合体 ~30,000 件 ホモ/ヘテロ二量体-リガンド ~数千件 三元複合体(PROTAC/glue)~数百件 → DL 汎化に必要な 10⁴ ~ 10⁵ オーダーには 2 桁不足
(c) 協同性 α が未解決の最重要課題
協同性 α = K_d(binary) / K_d(ternary) α > 1 (positive) POI E3 PPI 形成で結合増強 → 効率的な分解 α < 1 (negative) POI E3 PPI 不適合で結合低下 → 分解しない どの手法(多段・cofolding・FEP)でも α の事前定量予測は依然困難 → 経験的には実験測定(SPR/ITC)が今も第一選択

α は三元複合体の協同的安定化を表す無次元量。PROTAC が機能するか否かを決める最も支配的な指標だが、計算予測は道半ば。

(d) 公開実装と推奨ユースケース
ツール系統推奨ユースケース
PRosettaC多段既知 warhead/E3 リガンドが揃う系の精密ポーズ生成
COMPer多段大規模リンカーライブラリのスクリーニング
AF-MultimercofoldingPOI-E3 PPI 面の初期探索(リガンドはトレース可)
Chai-1cofoldingタンパク質+小分子の同時フォールディング
Boltz-2cofolding2026 時点の最新・三元複合体に対応した cofolding
MM-GBSA / FEP物理ΔGternary 評価でポーズを再ランク付け

PRosettaC: github.com/compsciencelab/PRosettaC / Chai-1: github.com/chaidiscovery/chai-lab / Boltz-2: github.com/jwohlwend/boltz

テイクホームメッセージ
多段 vs cofolding は補完関係
多段法は解釈性とサンプリング制御に優れ、cofolding は速度と網羅性で勝る。レビューは ハイブリッド での運用を勧める。
データ不足が DL の天井
PDB の三元複合体は ~数百件。データ拡張・自己教師あり事前学習・物理シミュレーション補完が今後の鍵。
協同性 α が次のフロンティア
ポーズが当たっても α が予測できなければ PROTAC の機能性は判定できない。FEP/MD と ML の橋渡しが必要。
多段+FEP リランクが現実解
サンプリング → cofolding 補助 → MM-GBSA/FEP 再評価という 3 段構成が、現状もっとも信頼できる予測パイプライン。
パイプラインへの応用
  • lib/docking: UniDockRunner にリンカー・コンフォメーション探索を組み合わせて多段 PROTAC ドッキング機能を新設
  • lib/docking: ProLIFCalculator で POI-リンカー / リンカー-E3 の二界面接触を同時集計
  • lib/fep: MMGBSAEngine を ΔGternary 評価に拡張(POI/E3/coop 3 項に分解)
  • cofolding 出力(Boltz-2)の取り込み口を追加し、生成ポーズを UniDockRunner 流のスコア体系に変換
インパクト
  • 標的分解(TPD)モダリティの計算駆動設計に向けた フレームワーク選定の指針 として直接利用可能
  • cofolding と物理計算の 役割分担 を明確化し、社内パイプラインの設計判断を支援
  • 協同性 α 予測という未解決問題を可視化し、研究投資の優先順位付けに寄与