力場ガイダンスでSBDD生成モデルの非物理ポーズを修正: TorchMMFF94
Lai, Wang, Sirelkhatim, Eaton, Huang, Engkvist, Janet, Tibo (AstraZeneca / NVIDIA) — NeurIPS 2025 Workshop: SimBioChem · OpenReview: oGywgZ5dR8
🎯 再訓練不要のMMFF94力場ガイダンスでSemlaFlow/EDMの歪みエネルギー75%削減・BNC 135%向上・Vina score 8 kcal/mol改善
① 問題設定と提案手法

拡散/フローマッチング系SBDDモデルは非物理的コンフォーメーション(結合長異常・タンパク質クラッシュ・高ひずみ)を生成するという既知の問題がある。本手法はMMFF94をタンパク質ポケット相互作用項で拡張し、その勾配を各サンプリングステップに注入することで解決する。

E(X,Y) = MMFF94(X) + EvdW(X,Y) + EQ(X,Y) # ガイダンス付きサンプリングステップ(フローマッチング): X_{t+ΔT} = X_t + ΔT·v - λ·∇_{X_t} E(X̂₁, Y) # λ < 2/L で各ステップのエネルギー単調非増加を理論保証
訓練不要
推論時プラグイン
GPU微分可能
SemlaFlow / EDM 対応
② 先行手法との比較
手法訓練要否タンパク質考慮理論保証
Classifier-guided条件付きなし
BADGERNN予測器なし
後処理MMFF94最小化不要なしなし
本手法(Guidance)不要あり(拡張)あり

古典力場の勾配注入のみで既存生成モデルを改善できる点が最大の強み

③ SemlaFlow定量結果(PDBBind, 140標的×128生成)
設定Vina (kcal/mol)Vina<0Glide<0BNCStrain E
No guidance+3.0447.0%19.41%2966.58
Guidance only-4.2064.25%56.61%6961.54
OPT only-4.2364.98%53.85%
Guidance+OPT-5.2165.59%59.06%1000+最低
④ 主要改善数値
-75%
Strain Energy削減 (6.58→1.54 kcal/mol)
+135%
BNC向上 (296→696、Guidance単独)
8 kcal/mol
Vina score改善 (+3.04→-5.21 kcal/mol)
⑤ 実装詳細
  • TorchMMFF94: GPU上でPyTorch自動微分対応のMMFF94実装
  • ポケット: ネイティブリガンドの3.5Å以内・重原子10個以上の残基
  • 前処理: Schrödinger PrepWizard(商用ライセンス要)
  • GeomDrugs事前訓練→PDBBind 18,990ペアfine-tune
λの最適値はターゲット依存→グリッドサーチ必要
前処理にSchrödinger Glideライセンスが必要
⑥ 限界点
  • MMFF94は古典力場(量子効果・水和・エントロピー未考慮)
  • ガイダンス計算の速度オーバーヘッド未定量
  • 合成可能性(SA-score)の評価が不在
  • 前処理に商用Schrödinger Glideが必要
⑦ テイクホームメッセージ
🔌 訓練不要のプラグイン
既存のSBDD生成モデルに後付けで適用可能。SemlaFlow・EDMの両方で効果を確認。
GPU微分可能MMFF94
TorchMMFF94でGPU上での高速勾配計算を実現。リガンド内+タンパク質-リガンド間を統合評価。
📐 理論保証付き
λ<2/Lでエネルギー単調非増加を数学的に証明。安定したサンプリングを保証。
🏆 Guidance+OPTの相乗効果
ガイダンスと後処理最適化の組み合わせが最高性能。BNC 1000超・Vina -5.21kcal/mol。
ケムインフォマティクスへの応用
適用先優先度ユースケース
lib/molgenHighMolgenYamlにMMFF94ガイダンス付きサンプリング統合
lib/dockingHighUniDockRunner前処理にTorchMMFF94ガイダンスを適用
lib/mdMediumMD初期構造の非物理ひずみを事前除去して平衡化短縮
lib/molgenMediumPoseBusterをMolgenYamlの品質チェックとして統合

TorchMMFF94(公開済み)をそのまま活用してlib/molgenのサンプリングループに組み込むことが可能