UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules
Yu, Huang, Liu (清華大学・人民大学) | arXiv: 2506.03157 | ICML 2025
🎯 小分子・ペプチド・タンパク質にまたがるクロスドメイン事前学習と Stochastic Interpolant+Force Guidance で、単一統一モデルにより大タイムステップ時間粗視化 MD を実現する。
① 背景と課題

古典 MD は安定性のため Δt≈10⁻¹⁵ 秒の極小タイムステップを必要とし、長時間挙動サンプリングが実用的に困難。深層学習による時間粗視化(τ >> Δt の直接学習)はこの制約を回避できるが、FBM・Timewarp・ITO など既存手法は特定ドメイン(ペプチドのみ・タンパク質のみ)に特化しており、新規分子系への転移適用が困難だった。

FBM はロイシン γ 炭素等のドメイン固有記述子に依存し、非天然アミノ酸不可
単一ドメイン特化モデルでは薬物様小分子—タンパク質複合体に適用できない

→ 6種異なるデータセットのマルチドメイン事前学習で統一原子表現を構築し、全ドメイン対応を実現

② 手法: 3段階アーキテクチャ
UniSim 3段階パイプライン Stage 1: マルチタスク事前学習 PCQM4Mv2(3M) + ANI-1x(5M) + PepMD + PDB + ATLAS + Solvated Frags Multi-Head Pretraining でスケール不均衡対処 → 統一原子表現モデル Stage 2: Stochastic Interpolant X_t → X_{t+τ} のベクトル場モデル(MDトラジェクトリから長時間ステップ学習) Stage 3: Force Guidance Kernel 温度・溶媒条件への軽量適応 — ゼロショット転移も可能 コンフォメーションサンプル
② 手法: マルチドメイン事前学習データ
6種データセット構成 PCQM4Mv2 3M分子 (DFT) ANI-1x 5M計算 (DFT) PepMD 283ペプチド MD PDB 単量体結晶構造 ATLAS 834タンパク質 MD Solvated Frags 多体相互作用 → 統一原子表現で全ドメイン転移可能
③ 本研究で示したこと(要点)
  • 小分子・ペプチド・タンパク質すべてで競合手法を上回る初の統一モデルを実現
  • ペプチド評価でFBM/Timewarp/ITOに対しTIC JS距離等の主要指標でほぼ最優秀
  • Force Guidance Kernelにより MD17→MD22 へゼロショット転移に成功(JS距離 0.408→0.368)
  • コード公開済み (GitHub: yaledeus/UniSim)—再現・統合が可能
④ 主な結果 (a) ペプチド評価 (PepMD, 14ペプチド)
TIC JS距離(低いほど良) ITO FBM Timewarp UniSim 0.61 0.57 0.55 0.510 best
④ 主な結果 (b) 小分子 Force Guidance 効果
0.368
UniSim TIC JS距離 (MD17→MD22 ゼロショット転移後)
0.408
UniSim/g (Force Guidance なし)

Force Guidance Kernel により新規化学環境への適応効果を実証( -9.8%)

④ 主な結果 (c) タンパク質 構造妥当性
タンパク質 構造妥当性 % (ATLAS 14タンパク質) 5% 8% ITO (baseline) UniSim JS距離も全指標でベースライン上回る
④ 主な結果 (d) ペプチド指標サマリ
指標FBMUniSim
TIC JS距離0.570.510
PWD JS距離0.340.328
Rg JS距離0.350.330
VAL-CA
ドメイン転移
⑤ テイクホームメッセージ
統一モデルの優位性
小分子・ペプチド・タンパク質すべてをカバーする初の統一 MD サロゲート。ドメイン固有チューニング不要。
Force Guidance の効率性
パラメータ効率的なカーネルで温度・溶媒等への適応を軽量に実現。ゼロショット転移も可能。
限界: タンパク質精度
累積予測誤差が大分子で顕著。構造妥当性はペプチドより低く、長時間自由エネルギー比較は困難。
lib/md 統合の可能性
HBondAnalyzer・RMSDAnalyzer のインプット軌跡をUniSimで高速生成—コンフォメーション探索コスト大幅削減。
先行手法との比較
手法小分子ペプチドタンパク質転移
FBM
Timewarp
ITO
UniSim
本研究のインパクト
  • ケムインフォ: lib/md のコンフォメーションアンサンブル生成を UniSim で置換/補完できる
  • lib/fep: FEP・MMGBSA の初期コンフォメーション多様性向上でコンバージェンス改善が期待
  • ICML 2025 採択・コード公開済み—研究への組み込み実現可能性が高い