MDシミュレーションの計算ボトルネックは力計算と数値積分という逐次プロセスに根ざす。MLFF(ANI・NequIP・MACE等)は力計算を高速化したが、femtosecond時間ステップの制約は解消されず、生物学的に重要なマイクロ秒〜ミリ秒スケールへのアクセスはなお困難だった。
→ 力計算・積分自体を省略して初期座標+時刻から直接軌道予測という根本的解法
ANI-1xデータセットから173分子系(9原子以下)の多様な初期条件から生成したデータセットで訓練。アンサンブル4モデル(m1〜m4、各約300万パラメータ)で不確実性推定と汎化性向上。fine-tuning時は少量の系固有データで大型系に対応。
テストセット: 3722本の1 ps軌道(200分子系:173既知+27未見)
| 手法 | 力計算 | 積分 | 速度 |
|---|---|---|---|
| DFT-MD | 要 | 要 | 最低 |
| MLFF+積分 | ML | 要 | 中 |
| TimeWarp | 要 | 大Δt | 中 |
| MDtrajNet | 不要 | 不要 | 100x↑ |
現段階は9原子以下小分子特化。タンパク質規模への拡張は今後の課題。
訓練データ: ANI-1x (173分子系×多様初期条件). アンサンブル4モデル(各〜3M params)