Improving Stereochemical Limitations in Protein-Ligand Complex Structure Prediction
Ishitani & Moriwaki | ACS Omega 2025, 10, 56075-56084 | DOI: 10.1021/acsomega.5c07675 | Category: computational_chemistry
AlphaFold3/Boltz-1のリガンドキラリティ反転を再学習なしで解決。逆拡散ステップに立体化学拘束を注入しキラリティ100%再現と結合幾何学改善を両立。コード公開済み。 #AlphaFold3 #Boltz1
(1) 背景と課題

AlphaFold3 (AF3) と そのオープン版 Boltz-1 はタンパク質-リガンド複合体構造予測において革命的な精度を実現したが、リガンド側に「立体化学誤り」という致命的欠陥が残る。SMILES で明確にキラリティを与えても、逆拡散生成中にキラリティが反転した出力を吐くケースが頻発し、結合長・結合角も理想値から逸脱する。

タンパク質側 RMSD 中央値 ≈ 0.36 Å という高精度の裏で、リガンド sp3 キラル中心が反転すれば薬効・選択性議論は破綻し、生合成・SBDD の実用性は大きく損なわれる。

Gap: 大規模拡散モデルの再学習はコスト膨大。推論のみで立体化学を矯正する汎用手法が未整備。
(2) 手法の概要 — Restraint-Guided Inference
SMILES + Protein Sequence ▼ EDM 逆拡散 step i Denoiser Dθ(x_i) → 予測座標 Restraint Loss L_chiral + w·(L_bond+L_angle) argmin で座標補正 ▼ 補正座標を次ステップへ x_(i-1) → 次の逆拡散ステップ ▼ 反復(全 step に拘束) 最終構造: キラリティ 100% 一致

RFDiffusion の Cα 硬拘束に着想。モデル重みは不変、推論のみ修正。ETKDGv3 を結合長・結合角の参照に採用。

(3) 本研究で示したこと
  • EDM の Denoiser 出力 Dθ は実験座標と同スケールで解釈可能、直接拘束操作に適する
  • 各逆拡散ステップで L_chiral + w_geom·(L_bond+L_angle) を最小化する閉形式補正が実現可能
  • Boltz R(全拘束×全ステップ) で キラリティ一致率 100%
  • 結合長・結合角 RMSD も改善し、リガンド RMSD はデフォルト Boltz-1 と同等水準を維持
  • R1(最終ステップのみ) では一部反転が残り、反復適用の重要性を実証
(4a) キラリティ一致率
sp3 キラリティ一致率 (%) 0 25 50 75 100 ~50% Boltz-1 default 100% Boltz Rc chiral only 100% Boltz R full restr. ~77% Boltz R1 last step

全ステップに拘束を適用した R / Rc が完全一致を達成。

(4b) タンパク質精度の維持

拘束の有無に依らず タンパク質 RMSD 中央値 ≈ 0.36 Å を維持(PLINDER-L95 Before)。学習データと類似度の低い After-P95L70 / After-P70L70 でも AF3 ≈ 0.6 Å, Boltz-1 ≈ 0.75 Å, 90 パーセンタイルは 2.5 Å 以下。

≈ 0.36 Å
タンパク質 RMSD 中央値 (PLINDER-L95 Before)
100% / 100%
キラリティ一致率 (Boltz R / Boltz Rc)

→ 拘束はタンパク質精度を犠牲にせずリガンド立体化学のみを矯正。

(4c) リガンド結合長・結合角 RMSD
ETKDGv3 参照との偏差(相対指標) Default Boltz-1 Boltz R (full) Boltz Rc 0 0.5 1.0 1.5 2.0 Bond Length 1.5 0.4 1.3 Bond Angle 1.6 0.5 1.5

R は両指標を約 1/3〜1/4 に圧縮、Rc はキラリティのみ補正のため幾何学は未改善。

(4d) 限界点
  • 拘束対象は sp3 炭素のみ、N/S 等の他キラル中心は未対応
  • 幾何学拘束重み w_geom はリガンド依存、自動調整法は未提案
  • 各ステップで argmin 計算追加、計算コスト詳細記述なし
  • 大型リガンド・複数リガンド同時系への適用は未評価
  • 比較対象 (DiffDock, AutoDock Vina) との結合ポーズ精度差は限定的
(5) テイクホームメッセージ
再学習不要
EDM 推論ステップのみ修正、AF3/Boltz-1 学習済み重みをそのまま再利用可能
キラリティ 100% 達成
Boltz R / Rc が sp3 キラル中心の反転を完全に消去
幾何学的に妥当
ETKDGv3 を参照に結合長・結合角 RMSD を顕著に改善 (R)
反復適用が鍵
最終ステップのみ (R1) では不十分、全ステップ拘束で初めて完全矯正

SBDD・生合成研究での AF3/Boltz-1 出力をそのまま「実用可能な複合体構造」として使用するための必須前処理になりうる。

ケムインフォマティクス応用
適用先応用シナリオ
lib/dockingAF3/Boltz-1 出力を UniDockRunner の入力前に立体化学検証 → 不正キラリティ構造の自動棄却
lib/fepRestraint-Guided 構造を MMGBSAEngine の初期座標に採用、立体異性体由来のスコア揺らぎを抑制
lib/mdMD 初期構造としての品質保証、ETKDGv3 ベースの結合長/角アサーションをパイプライン化
本研究のインパクト
  • 大規模拡散モデルの実用化障壁を除去: 再学習なしの推論時介入という新パラダイム
  • SBDD/CADD で AF3 系構造を即時利用可能に: キラリティ反転による誤った SAR 解釈を防止
  • RFDiffusion 流の拘束付き拡散をリガンド領域へ拡張、今後の拡散モデル設計指針を提示