Improving Stereochemical Limitations in Protein-Ligand Complex Structure Prediction

Ishitani & Moriwaki | ACS Omega 2025, 10, 56075-56084 | DOI: 10.1021/acsomega.5c07675 | Category: computational_chemistry

AlphaFold3/Boltz-1のリガンドキラリティ反転を再学習なしで解決。逆拡散ステップに立体化学拘束を注入しキラリティ100%再現と結合幾何学改善を両立。コード公開済み。 #AlphaFold3 #Boltz1

(1) 背景と課題

AlphaFold3 (AF3) とそのオープン版 Boltz-1 はタンパク質-リガンド複合体構造予測において革命的な精度を実現したが、リガンド側に「立体化学誤り」という致命的欠陥が残る。SMILES で明確にキラリティを与えても、逆拡散生成中にキラリティが反転した出力を吐くケースが頻発し、結合長・結合角も理想値から逸脱する。

タンパク質側 RMSD 中央値 ≈ 0.36 Å という高精度の裏で、リガンド sp3 キラル中心が反転すれば薬効・選択性議論は破綻し、生合成・SBDD の実用性は大きく損なわれる。

Gap: 大規模拡散モデルの再学習はコスト膨大。推論のみで立体化学を矯正する汎用手法が未整備。

(2) 手法の概要 — Restraint-Guided Inference

RFDiffusion の Cα 硬拘束に着想。モデル重みは不変、推論のみ修正。ETKDGv3 を結合長・結合角の参照に採用。

(3) 本研究で示したこと

EDM の Denoiser 出力 Dθ は実験座標と同スケールで解釈可能、直接拘束操作に適する
各逆拡散ステップで L_chiral + w_geom·(L_bond+L_angle) を最小化する閉形式補正が実現可能
Boltz R(全拘束×全ステップ) で キラリティ一致率 100%
結合長・結合角 RMSD も改善し、リガンド RMSD はデフォルト Boltz-1 と同等水準を維持
R1(最終ステップのみ) では一部反転が残り、反復適用の重要性を実証

(4a) キラリティ一致率

全ステップに拘束を適用した R / Rc が完全一致を達成。

(4b) タンパク質精度の維持

拘束の有無に依らず タンパク質 RMSD 中央値 ≈ 0.36 Å を維持(PLINDER-L95 Before)。学習データと類似度の低い After-P95L70 / After-P70L70 でも AF3 ≈ 0.6 Å, Boltz-1 ≈ 0.75 Å, 90 パーセンタイルは 2.5 Å 以下。

≈ 0.36 Å

タンパク質 RMSD 中央値 (PLINDER-L95 Before)

100% / 100%

キラリティ一致率 (Boltz R / Boltz Rc)

→ 拘束はタンパク質精度を犠牲にせずリガンド立体化学のみを矯正。

(4c) リガンド結合長・結合角 RMSD

R は両指標を約 1/3〜1/4 に圧縮、Rc はキラリティのみ補正のため幾何学は未改善。

(4d) 限界点

拘束対象は sp3 炭素のみ、N/S 等の他キラル中心は未対応
幾何学拘束重み w_geom はリガンド依存、自動調整法は未提案
各ステップで argmin 計算追加、計算コスト詳細記述なし
大型リガンド・複数リガンド同時系への適用は未評価
比較対象 (DiffDock, AutoDock Vina) との結合ポーズ精度差は限定的

(5) テイクホームメッセージ

再学習不要
EDM 推論ステップのみ修正、AF3/Boltz-1 学習済み重みをそのまま再利用可能

キラリティ 100% 達成
Boltz R / Rc が sp3 キラル中心の反転を完全に消去

幾何学的に妥当
ETKDGv3 を参照に結合長・結合角 RMSD を顕著に改善 (R)

反復適用が鍵
最終ステップのみ (R1) では不十分、全ステップ拘束で初めて完全矯正

SBDD・生合成研究での AF3/Boltz-1 出力をそのまま「実用可能な複合体構造」として使用するための必須前処理になりうる。

ケムインフォマティクス応用

適用先	応用シナリオ
lib/docking	AF3/Boltz-1 出力を UniDockRunner の入力前に立体化学検証 → 不正キラリティ構造の自動棄却
lib/fep	Restraint-Guided 構造を MMGBSAEngine の初期座標に採用、立体異性体由来のスコア揺らぎを抑制
lib/md	MD 初期構造としての品質保証、ETKDGv3 ベースの結合長/角アサーションをパイプライン化

本研究のインパクト

大規模拡散モデルの実用化障壁を除去: 再学習なしの推論時介入という新パラダイム
SBDD/CADD で AF3 系構造を即時利用可能に: キラリティ反転による誤った SAR 解釈を防止
RFDiffusion 流の拘束付き拡散をリガンド領域へ拡張、今後の拡散モデル設計指針を提示