Artificial Intelligence for Direct Prediction of Molecular Dynamics Across Chemical Space
MLatom / Aitomistic | DOI: 10.1021/acs.jctc.5c01689 | Published: 2025-05 (arXiv) / JCTC
🎯 力計算・数値積分を一切行わず、初期条件(R₀, v₀, z)と目標時刻tのみから直接 R_t を予測する全化学空間対応MDサロゲートモデル「MDtrajNet」を提案・実証する。
① 背景と課題

MDシミュレーションはニュートン方程式の逐次数値積分が本質的ボトルネックとなっており、MLIP(MACE, NequIP 等)は力計算を高速化するものの逐次積分の制約は解消できない。先行の深層生成モデルは平衡分布サンプリングに特化し、時間決定論的な軌跡生成には対応していない。

MLIPは逐次積分ボトルネックを根本解決できない—最細タイムステップで依然として律速
既存の4D先行手法GICnetは汎化座標記述子を使用し特定分子にのみ適用可能

→ E(3)等変ネットワーク×Transformerで全化学空間に転移可能な直接時刻予測モデルを構築

② 手法の概要: 4D-Spacetime入力設計
MDtrajNet 入力→出力 R₀ (座標) v₀ (速度) z, t E(3)等変 Attention × 8 blocks 球面調和関数 l_max=3, 4-head, ~310万params R_t 直接予測(並列)
② 手法の概要: Long-time伝播とアンサンブル

長時間軌跡は8fsセグメントをオートリグレッシブにつないで生成。4サブモデルアンサンブルで不確実性を定量化。

オートリグレッシブ長時間伝播 seg 1 0→8fs seg 2 8→16fs seg N …→10ps 4サブモデルアンサンブル M1 M2 M3 M4 平均+不確実性推定
③ 本研究で示したこと(要点)
  • 力計算・数値積分なしで直接 R_t を予測—同一軌跡の複数時刻を並列生成可能
  • 既知分子97.9%・未知分子95.4%で安定10ps軌跡を再現
  • 最細タイムステップ比でMLIP比100倍の速度向上を達成
  • アラニンジペプチドでは32psの訓練データでRamachandran分布を正確に再現
④ 主な結果 (a) 軌跡安定性(成功率)
10ps軌跡 安定率 (%) MLIP(ref) 既知分子 未知分子 ~80% 97.9% 95.4% 0 20 50 100
④ 主な結果 (b) 速度比較(対MLIP)
計算速度 (相対、MLIP=1) ×1 ×100 MLIP MDtrajNet (最細Δt比) 並列複数時刻予測により逐次積分を回避
④ 主な結果 (c) スペクトル類似度

パワースペクトルのPearson相関係数(10ps軌跡から計算)

モデル相関係数備考
ANI-1ccx (全化学空間)最高水準参照
MDtrajNet同等✓ 直接予測
MLIP (ANI再構築)やや低逐次積分
GICnet (先行)特定分子のみ汎化なし

→ 全化学空間対応MLIPと同等の構造再現性を達成

④ 主な結果 (d) ファインチューニング性能

アラニンジペプチド Ramachandran分布再現性

コンフォーマー再現率 (32ps訓練データ) C5 MDtrajNet C7eq 再現 αr 再現 ANI (同一データ一から訓練) は再現失敗 — 事前学習の効果が大
⑤ テイクホームメッセージ
逐次積分からの解放
力計算不要・複数時刻並列予測でMLIP比100倍の速度。MD探索の計算コスト障壁を根本から低下させる。
転移可能性
E(3)等変アーキテクチャにより原子種・分子サイズをまたいだ転移学習が可能。32psファインチューニングで新分子対応。
限界と課題
現状9原子以下の小分子が中心。薬物様分子や蛋白質への拡張には大規模高品質データが必要。失敗率2〜5%。
オープン実装
MLatom (Aitomistic) に実装済み。チュートリアル公開・データセットMITライセンス。再現・応用が容易。
先行手法比較
手法積分不要全化学空間速度
MLIP (MACE等)一部
GICnet
拡散モデル一部高(平衡のみ)
MDtrajNet×100
本研究のインパクト
  • MDの逐次積分パラダイムを「直接時刻予測」に転換—計算化学の根本的な加速
  • ケムインフォマティクスパイプラインへの統合:lib/md での高速サロゲートMDとして活用可能
  • 事前学習+少量ファインチューニングにより、新規化合物への適用コストを大幅削減