DiffPIE: Physics-Guided Foundation Model Extrapolation

DiffPIE: Extrapolating Foundation Generative Models with Physics for Protein-Environment Interactions

Yanbin Wang & Ming Chen — J. Phys. Chem. Lett. 2025 | DOI: 10.1021/acs.jpclett.5c02567 | 🤖 machine_learning | 💻 github.com/mingchenPurdueChem/DiffPIE

🎯 再訓練不要で基盤拡散モデルを PEI ドメインに外挿
環状ペプチド + 金表面系でメタダイナミクスと同等の精度を数桁高速に実現

① 背景と課題

AlphaFold / Str2Str 等の基盤生成モデルはタンパク質単体の構造を学習するが、有機リンカー付き環状ペプチドや材料表面への吸着といった外部環境との相互作用（PEI）を含む系には未対応。

再訓練・ファインチューニングは大量の PEI 付きデータが必要 → データ収集コストが壁

全原子 MD はコンフォメーション探索に μs 〜 ms スケール必要

既存誘導サンプリング（Boltz-steering 等）は内部幾何拘束のみで PEI への汎化なし

② DiffPIE の仕組み

事前学習済み拡散モデル（Str2Str）
↓
逆拡散 SDE のドリフト項に Uext バイアスを注入
dx = [s_θ(x,t) + λ(t)·F(x,t)]dt + g(t)dw̄
↓
λ(t) スケジューラー: t→1 でバイアス弱、t→0 で強
↓
PEI 条件下のコンフォメーション分布を近似生成

再訓練不要

任意の拡散モデルにプラグインとして適用可能

③ 2 ケーススタディ

① P3-F 環状ペプチド（有機リンカー付き）

Keap1-Nrf2 PPI 阻害 → Uext = リンカー拘束ポテンシャル
→ 安定コンフォメーションを UMAP 全体をカバーして生成
→ Keap1 結合型 PDB 構造（準安定）も再現

② Aβ16-22 + Au(111) 表面（金吸着）

Uext = Lennard-Jones 型ペプチド-金相互作用
→ 表面吸着変性構造をメタダイナミクスと高一致で再現

④ 先行研究との比較

手法	PEI 対応	再訓練	速度
全原子 MD	○（明示）	不要	遅い（μs〜ms）
Boltz-steering	△（内部拘束のみ）	不要	速い
ファインチューニング	○	必要	速い（推論時）
DiffPIE	○（任意）	不要	MD より数桁高速

⑤ 限界点

Cα 座標のみバイアス適用 → 残基配向（SO3）は未対応
フラグメント近似 → 長距離・多体相互作用を完全には捉えられない
大型タンパク質（>200 残基）への適用は基盤モデル自体の拡張が必要
Uext の適切な設計にドメイン知識が必要

⑥ パイプライン統合提案

lib/md: DiffPIE ラッパーを組み込み、環状ペプチドの PEI コンフォマー生成 + HBondAnalyzer/RMSDAnalyzer へのフィード
lib/docking: DiffPIE 生成コンフォマーを UniDockRunner のアンサンブルドッキング入力に使用 → Keap1 等 PPI 標的への環状ペプチドドッキング精度向上
lib/molgen: CycPepVAE 生成物 → DiffPIE でリンカー付き 3D 構造を生成 → 下流評価精度向上

github.com/mingchenPurdueChem/DiffPIE

実装公開済み