Polyformer: A Generative Framework for Thermodynamic Modeling of Polymeric Molecules
Valentini, Pekker, Liang, Martinez, Mukhopadhyay (PsiDagger / Pittsburgh / Stanford) | arXiv:2604.14241 | 2026年4月
🎯 温度条件付きDiffusion Transformerでタンパク質のコンフォメーションアンサンブルを生成。折り畳み・熱揺らぎ・熱変性を単一フレームワークで解く
① 背景と課題

分子生物学は「配列が構造を決定する」パラダイムから「コンフォメーションアンサンブル全体が機能を決定する」アンサンブルパラダイムへ移行しつつある。AlphaFoldは単一最良コンフォメーション予測を解いたが、構造分布や温度依存的な変性挙動は予測できない。

AlphaFold・ESMFold等:単一コンフォメーション予測のみ、温度コンディショニング非対応
既存アンサンブルモデル(Framediff等):温度などの熱力学変数を条件入力に取り込む設計なし

→ 温度を直接条件入力とした生成モデルで折り畳み・熱揺らぎ・熱変性を統一的に解く

② DiTアーキテクチャ

N=8ブロックのDiffusion Transformer。RoPEによる配列位置エンコーディングと2種類のAdaLN-Zeroゲーティング(ノイズ時刻用・温度用)を組み合わせ。

ESM-2埋め込み (1280→158次元) 3D Fourier 並進エンコード Wigner D行列 DiT×8ブロック AdaLN-Zero(T) 並進・回転 chi角出力 訓練データ: mdCATH 320/348/379/413/450 K (5温度)
② 温度コンディショニング

同一タンパク質ドメインについて低温(構造安定)から高温(無秩序・変性)まで連続的にコンフォメーションアンサンブルを生成できる。

温度↑ → コンフォメーション多様化 320K 348K 379K 413K 450K 構造安定性の低下(変性)を連続的に生成
③ 本研究で示したこと(要点)
  • 折り畳み・熱揺らぎ・熱変性を単一生成フレームワークで同時解決
  • 温度上昇に伴うRg増大と無秩序化をラマチャンドランプロットで再現
  • 残基別RMSF・Rg分布でmdCATHとの定量的一致を実証
  • アンサンブルドッキング・cryptic pocket検出・FEP初期構造生成への応用展望
④ 主な結果 (a) Rg(回転半径)の温度依存性
Rg分布の温度依存性(定性) 320K 348K 379K 413K+ 大(変性) 高温ほどRg増大 → 変性トレンドを再現
④ 主な結果 (b) ラマチャンドランプロット再現性
評価指標再現品質
α-helix領域ピーク定性的に再現
β-sheet領域ピーク定性的に再現
高温でのピーク縮小トレンド再現
サテライトピーク詳細一部不一致あり

lg2rA00で300サンプル/温度で定量比較

④ 主な結果 (c) 既存モデルとの差別化
モデル単一構造アンサンブル温度条件付
AlphaFold××
ESMFold××
Framediff×
Polyformer
④ 主な結果 (d) ケムインフォ応用シナリオ
lib/docking
多様な受容体コンフォメーションでアンサンブルドッキング → induced fit効果を考慮
lib/fep
温度別サンプルをFEP初期構造アンサンブルとして活用 → コンバージェンス改善

cryptic pocket検出:変性コンフォメーションでアロステリック部位探索

⑤ テイクホームメッセージ
アンサンブルパラダイムへの対応
AlphaFoldが解いた「単一構造」問題を超え、熱力学的に正確な構造分布を生成
温度コンディショニングの新規性
mdCATHの多温度MDデータで初めて実現。低温から変性温度まで連続生成
アンサンブルドッキングへの直接応用
lib/dockingでUniDockRunnerと組み合わせ、受容体柔軟性を考慮したVSを実現
限界の正直な開示
小ドメイン限定・サテライトピーク不一致・コード未公開(preprint)。今後の発展に期待
訓練・評価設定
項目内容
訓練データmdCATH 50-111残基ドメイン
温度条件320/348/379/413/450 K
評価ドメインlg2rA00(無秩序型)/ 3g0vA00(安定型)
評価指標ラマチャンドラン・RMSF・Rg
本研究のインパクト
  • AlphaFold後の「熱力学的アンサンブル生成」という次の重要課題に初めて答えた
  • アンサンブルドッキングでinduced fit・cryptic pocket検出が計算コスト大幅削減で可能に
  • FEPレプリカエクスチェンジの初期構造多様性担保でコンバージェンス改善期待