UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules

Yu, Huang, Liu (清華大学・人民大学) | arXiv: 2506.03157 | ICML 2025

🎯 小分子・ペプチド・タンパク質にまたがるクロスドメイン事前学習と Stochastic Interpolant+Force Guidance で、単一統一モデルにより大タイムステップ時間粗視化 MD を実現する。

① 背景と課題

古典 MD は安定性のため Δt≈10⁻¹⁵ 秒の極小タイムステップを必要とし、長時間挙動サンプリングが実用的に困難。深層学習による時間粗視化（τ >> Δt の直接学習）はこの制約を回避できるが、FBM・Timewarp・ITO など既存手法は特定ドメイン（ペプチドのみ・タンパク質のみ）に特化しており、新規分子系への転移適用が困難だった。

FBM はロイシン γ 炭素等のドメイン固有記述子に依存し、非天然アミノ酸不可

単一ドメイン特化モデルでは薬物様小分子—タンパク質複合体に適用できない

→ 6種異なるデータセットのマルチドメイン事前学習で統一原子表現を構築し、全ドメイン対応を実現

② 手法: 3段階アーキテクチャ

② 手法: マルチドメイン事前学習データ

③ 本研究で示したこと（要点）

小分子・ペプチド・タンパク質すべてで競合手法を上回る初の統一モデルを実現
ペプチド評価でFBM/Timewarp/ITOに対しTIC JS距離等の主要指標でほぼ最優秀
Force Guidance Kernelにより MD17→MD22 へゼロショット転移に成功（JS距離 0.408→0.368）
コード公開済み (GitHub: yaledeus/UniSim)—再現・統合が可能

④ 主な結果 (a) ペプチド評価 (PepMD, 14ペプチド)

④ 主な結果 (b) 小分子 Force Guidance 効果

0.368

UniSim TIC JS距離 (MD17→MD22 ゼロショット転移後)

0.408

UniSim/g (Force Guidance なし)

Force Guidance Kernel により新規化学環境への適応効果を実証（ -9.8%）

④ 主な結果 (c) タンパク質構造妥当性

④ 主な結果 (d) ペプチド指標サマリ

指標	FBM	UniSim
TIC JS距離	0.57	0.510
PWD JS距離	0.34	0.328
Rg JS距離	0.35	0.330
VAL-CA	中	高
ドメイン転移	✗	✓

⑤ テイクホームメッセージ

統一モデルの優位性
小分子・ペプチド・タンパク質すべてをカバーする初の統一 MD サロゲート。ドメイン固有チューニング不要。

Force Guidance の効率性
パラメータ効率的なカーネルで温度・溶媒等への適応を軽量に実現。ゼロショット転移も可能。

限界: タンパク質精度
累積予測誤差が大分子で顕著。構造妥当性はペプチドより低く、長時間自由エネルギー比較は困難。

lib/md 統合の可能性
HBondAnalyzer・RMSDAnalyzer のインプット軌跡をUniSimで高速生成—コンフォメーション探索コスト大幅削減。

先行手法との比較

手法	小分子	ペプチド	タンパク質	転移
FBM	✗	✓	✗	✗
Timewarp	✗	✓	✗	✗
ITO	✗	✗	✓	✗
UniSim	✓	✓	✓	✓

本研究のインパクト

ケムインフォ: lib/md のコンフォメーションアンサンブル生成を UniSim で置換/補完できる
lib/fep: FEP・MMGBSA の初期コンフォメーション多様性向上でコンバージェンス改善が期待
ICML 2025 採択・コード公開済み—研究への組み込み実現可能性が高い