タンパク質-リガンド結合ダイナミクスのMDシミュレーションは創薬において結合親和性・輸送特性・ポケット動力学の予測に不可欠である。しかし従来の数値MD(GROMACS等)は個々の原子に対する力計算が極めて重く、ナノ秒を超える長時間シミュレーションは計算コスト上の難問であった。例えば GROMACS では 0.28 時間/ns を要し、大規模スクリーニングや µs スケール解析の障壁となっている。
ML ベースの MD(HDNNPs, DeePMD, TorchMD, Allegro)はエネルギー面フィッティングに留まり、対象は単一分子に限定されてきた。タンパク質-リガンド複合体への本格的 ML サロゲートは未確立であった。MISATO データセット(2023 年公開、PDB 由来 16,972 複合体の 8 ns NVT MD)の登場で初めて大規模学習が可能となった。
座標を直接予測せず加速度を予測 → 2 次積分することで Newton 第二法則を暗黙の制約として組み込み、長時間ロールアウトの安定性を確保。
MISATO(PDB 由来 16,972 複合体, X 線結晶 + 半経験的 QM, 8 ns NVT MD)を使用。Semi-flexible 設定(タンパク剛体・リガンド柔軟)で、初期座標 x₀ と初期速度 v₀ から 100 スナップショット(8 ns、0.08 ns 間隔)の軌跡を予測。
評価指標: MAE / RMSE(再構成精度)+ Matching / Stability(有効性)。Stability はリガンド原子ペア距離が真値との差 ≤ 0.5 Å に収まる割合。
| 応用先 | ユースケース | 期待効果 |
|---|---|---|
| lib/md | ML サロゲートで MD 軌跡生成(SE(3) 等変 + ODE/SDE) | 1000× 加速・大規模 VS |
| lib/docking | ドッキングポーズの動的安定性スクリーニング | 偽陽性ポーズ除去 |
RMSDAnalyzer / HBondAnalyzer の前段に NeuralMD 軌跡生成を組み込むことで、結晶構造単発の解析から「動的アンサンブル」解析へ拡張可能。