LAMMPS-ANI: Large-Scale MD with ANI Neural Network Potential
Xue, Terrel, Pickering, Roitberg — University of Florida | ChemRxiv 2025 | DOI: 10.26434/chemrxiv-2025-8v03m
🎯 ANI MLIP を LAMMPS に統合し、QM精度のMDを最大1億原子・128 GPUスケールで実現する
① 背景と課題

古典力場は固定パラメータ・近似に制限され、複雑な反応や分極効果を正確に記述できない。QM計算は高精度だが計算コストが巨大で大系への適用が不可能。MLIPは両者のギャップを埋める有力な手段だが、従来実装は小規模系に限定され、多数GPUへのスケーリングが困難だった。

メッセージパッシングニューラルネット(Allegro, MACE等)は受容野の急拡大でスケーリングが困難
MLIPのMD不安定性問題:過大なタイムステップが根本原因(HMR/SHAKEで解決可能)

→ ANIの短いカットオフ半径(局所記述子)を活用し、理想的な弱スケーリングを達成

② ANI-LAMMPS統合アーキテクチャ
LAMMPS ドメイン分解
↓ フォワード通信(ゴースト原子取得)
↓ ANI C++ インターフェース
↓ CUAEV(CUDA AEV計算)→ TorchScript ANIモデル
↓ 自動微分で力・ストレス算出
↓ 逆通信で力集計 → 時間積分
↑ 次ステップへ

LAMMPSを再コンパイルせず dynamic library pluginとして統合。Kokkos GPUバックエンドで全内部演算GPU化。

③ 主要最適化技術
  • CUAEV: AEV計算をCUDAカスタムカーネルで実装。full/half neighbor listサポート
  • Kokkos GPUバックエンド: ネイバーリスト計算・座標更新等を全GPU化しCPU-GPU転送排除
  • CUDA-aware Open MPI: GPU間直接通信で多ノード通信効率化
  • Batched行列積: アンサンブル複数モデル使用時のオーバーヘッド削減
  • HMR + SHAKE: 2 fsタイムステップで100ns以上の安定MD
④ ベンチマーク結果: スケーリング
システム原子数GPU数性能Allegro比
水系100k4112 ts/s28×速
水系100M128
HIV capsid44M1288.5 ts/s同等@5120 GPU
MACE比100k134 ts/s14×速
30〜60×
Allegroモデルに対する速度優位性(FP32 vs TF32)
⑤ 精度検証: アラニンジペプチド

傘サンプリング(25×25 ψ/φウィンドウ)で FES を計算。

  • 真空中 FES: QM計算と高い一致
  • 水溶液: 6,250構造でファインチューニング後に大幅改善
  • A100 1枚で 43.4 ns/day(HMR + 2 fs timestep)
b973c汎関数では水密度 0.83 g/cm³(実験値1.0)→ wb97xへの改善が課題
⑥ 大規模反応シミュレーション応用

メタン燃焼(300k原子, 8 A100 GPU, 1 ns, 2500K NVT)

ANI-2x + xTB反発補正で燃焼反応経路を追跡

初期地球化学実験(228k原子, 4 ns, 0→2500→300K)

H₂, H₂O, CO, NH₃, CH₄混合系からのグリシン自発的生成を確認

🧬 cumolfind (GPU加速フラグメント検出) で軌跡中の分子種を自動同定
⑦ 創薬パイプラインへの応用可能性 (lib/md)
🔬 QM精度タンパク質-リガンドMD
ANI-2xで古典力場の限界を超えた結合ポーズ動的評価。非標準官能基・ハロゲン系に特に有効。lib/md の RMSDAnalyzer / HBondAnalyzer と組み合わせて量子力学精度のMD解析パイプラインを構築。
📊 アンサンブル不確実性スコア
8モデルのエネルギー分散 (std/mean) を「力場信頼度」指標として使用。不確実性の高いコンフォメーションをフラグ立てしてFEP計算前の品質管理フィルタとして機能させる。
⚡ FEPプレスクリーニング
1〜10 ns ANI-MD による結合ポーズ安定性スクリーニングをlib/fepに統合。不安定ポーズを事前排除してFEPコストを最適化。
🧪 反応機構解析
共有結合性阻害剤・金属酵素(ANI対応元素内)の反応機構MD解析が可能。cumolfindによる反応中間体自動追跡をlib/mdに組み込み。
⑧ 限界・今後の課題
ANI対応元素: H, C, N, O, S, F, Cl のみ(金属・Br・I非対応)
長距離静電・分散力の記述が困難(短いカットオフ半径の制約)
水密度誤差 (b973c): wb97xレベルへの再訓練が必要
等変ニューラルネット(Allegro, MACE)との精度比較が限定的

💡 将来: ANI-2xのwb97xファインチューニング版、金属対応拡張版に期待