DiffPIE: Extrapolating Foundation Generative Models with Physics for Protein-Environment Interactions
Yanbin Wang & Ming Chen — J. Phys. Chem. Lett. 2025 | DOI: 10.1021/acs.jpclett.5c02567 | 🤖 machine_learning | 💻 github.com/mingchenPurdueChem/DiffPIE
🎯 再訓練不要で基盤拡散モデルを PEI ドメインに外挿
環状ペプチド + 金表面系でメタダイナミクスと同等の精度を数桁高速に実現
① 背景と課題

AlphaFold / Str2Str 等の基盤生成モデルはタンパク質単体の構造を学習するが、有機リンカー付き環状ペプチドや材料表面への吸着といった外部環境との相互作用(PEI)を含む系には未対応。

再訓練・ファインチューニングは大量の PEI 付きデータが必要 → データ収集コストが壁
全原子 MD はコンフォメーション探索に μs 〜 ms スケール必要
既存誘導サンプリング(Boltz-steering 等)は内部幾何拘束のみで PEI への汎化なし
② DiffPIE の仕組み
事前学習済み拡散モデル(Str2Str)

逆拡散 SDE のドリフト項に Uext バイアスを注入
dx = [s_θ(x,t) + λ(t)·F(x,t)]dt + g(t)dw̄

λ(t) スケジューラー: t→1 でバイアス弱、t→0 で強

PEI 条件下のコンフォメーション分布を近似生成
再訓練不要
任意の拡散モデルにプラグインとして適用可能
③ 2 ケーススタディ

① P3-F 環状ペプチド(有機リンカー付き)

Keap1-Nrf2 PPI 阻害 → Uext = リンカー拘束ポテンシャル
→ 安定コンフォメーションを UMAP 全体をカバーして生成
→ Keap1 結合型 PDB 構造(準安定)も再現

② Aβ16-22 + Au(111) 表面(金吸着)

Uext = Lennard-Jones 型ペプチド-金相互作用
→ 表面吸着変性構造をメタダイナミクスと高一致で再現

④ 先行研究との比較
手法PEI 対応再訓練速度
全原子 MD○(明示)不要遅い(μs〜ms)
Boltz-steering△(内部拘束のみ)不要速い
ファインチューニング必要速い(推論時)
DiffPIE○(任意)不要MD より数桁高速
⑤ 限界点
  • Cα 座標のみバイアス適用 → 残基配向(SO3)は未対応
  • フラグメント近似 → 長距離・多体相互作用を完全には捉えられない
  • 大型タンパク質(>200 残基)への適用は基盤モデル自体の拡張が必要
  • Uext の適切な設計にドメイン知識が必要
⑥ パイプライン統合提案
  • lib/md: DiffPIE ラッパーを組み込み、環状ペプチドの PEI コンフォマー生成 + HBondAnalyzer/RMSDAnalyzer へのフィード
  • lib/docking: DiffPIE 生成コンフォマーを UniDockRunner のアンサンブルドッキング入力に使用 → Keap1 等 PPI 標的への環状ペプチドドッキング精度向上
  • lib/molgen: CycPepVAE 生成物 → DiffPIE でリンカー付き 3D 構造を生成 → 下流評価精度向上
github.com/mingchenPurdueChem/DiffPIE
実装公開済み