KIMMDY: A Biomolecular Reaction Emulator
Hartmann, Buhr, Riedmiller et al. (HITS / MPI-P) | Nat. Commun. 17:3500 | 2026 | DOI: 10.1038/s41467-026-71955-2 | Category: computational_chemistry
kMC+MD+GNN速度予測で生体分子反応を秒スケールでエミュレートするKIMMDY。QM/MM不要でHAT・求核置換・光二量化を実験値と一致再現。タンパク質・DNA対応。 #KIMMDY #MD #反応性
(1) 背景と課題

古典力場MDは生体分子の結合生成・切断を扱えないため、酸化ストレス・光損傷・酵素反応など反応性を伴う現象を時間発展として追跡できない。一方でQM/MMやMLIPは遷移状態探索の計算コストが膨大で、ナノ秒以上のタイムスケールへのスケーリングが困難である。

研究ギャップ: ナノ秒スケールしか扱えないMDと、ミリ秒~秒スケールで進行する生体反応カスケード(コラーゲン酸化・DNA光損傷など)のあいだに10⁹倍以上のギャップが存在する。
従来手法の比較:
手法反応性到達時間計算コスト
古典MD (GROMACS)×ns~μs
ReaxFFps~ns
QM/MMps非常に高
MLIPns
KIMMDY (本研究)~秒以上低~中
(2) 手法の概要 (KIMMDYワークフロー)
(1) MD: コンフォメーションアンサンブル生成 (2) 反応サーチ: 反応物ペアの同定 (3) GNN速度予測 (DFTバリア学習) (4) kMC選択 (Gillespie) (5) トポロジー更新 → MDへ戻る

遷移状態を一切探索せず、反応物構造のみから速度を推定する点が技術的核心。モジュラー設計で新規反応タイプを追加可能。

(3) 本研究で示したこと
  • 古典MDに反応性を付与する kMC+GNN+MD 統合フレームワークを構築
  • HAT・求核置換・光二量化の3反応タイプで実験値と一致する選択確率を再現
  • 1-5 H-shift優位性を実験どおり予測 (n-アルキルラジカル)
  • コラーゲン等のタンパク質・DNAチミン二量体形成へ適用
  • 秒スケール反応カスケードの実用的サンプリングを達成
  • OSS公開: graeter-group/kimmdy (GROMACS互換)
(4)-a HAT水素シフト選択確率 (n-アルキルラジカル)
水素シフト選択確率 (1-オクチルラジカル) 100% 75% 50% 25% 0 1-2 1-3 1-4 25% 62% 59% 1-5 1-6 水素シフトタイプ KIMMDY 実験値

1-5シフトが最高確率として実験と一致再現。1-2/1-3はバリアの環歪みエネルギーで強く抑制される傾向も正確に予測。

(4)-b タンパク質適用 (コラーゲン酸化)

コラーゲン分子に対してラジカル反応カスケードをエミュレート。酸化ストレス下での生体高分子ダメージの動態を、ピコ秒のMD刻み×秒スケールのkMC統合で初めて連続的に追跡できることを実証した。

到達可能な反応時間スケール (従来比 10⁹倍)
3 種 対応反応タイプ (HAT / 求核置換 / 光二量化)
DFT GNNトレーニングのバリア精度ソース

競合する複数反応 (HAT + 求核置換 + 光二量化) が同時条件でも、Gillespieアルゴリズムで適切な選択比を維持できることを確認。

(4)-c DNAチミン二量化 & 反応コスト比較
手法別 到達時間スケール (log) 10⁰ s 10⁻³ 10⁻⁶ 10⁻⁹ 10⁻¹² QM/MM ps MLIP ns ReaxFF ps-ns 古典MD μs KIMMDY → 反応性 / 計算複雑度

UV照射下でのシクロブタン型ピリミジン二量体 (CPD) 形成を再現。光化学反応もモジュール追加で扱える拡張性を実証。

(4)-d 限界点
  • GNN速度モデルの汎化性はDFT学習データの質・量に強く依存する
  • 新規反応タイプ拡張には新たなDFTバリア計算が必要
  • MD (ns) と kMC (秒) の時間スケールギャップ — 各サイクル間でMD収束を仮定
  • 確率的エミュレーションのため個別軌跡の物理精度より統計的反応確率の再現が中心
  • 特定の反応経路の分子機構解析には追加検証が必要
  • 反応パスの3D経路精度は本論文の中心的検証対象ではない
(5) テイクホームメッセージ
遷移状態探索の回避
反応物構造のみからGNNで速度推定し、QM/MMの最大コスト要因を排除。
kMC × MD のループ統合
GillespieアルゴリズムでMD構造から競合反応を確率的に選択。
秒スケール反応カスケード
従来比10⁹倍以上の時間スケールで生体反応を追跡可能に。
モジュラー拡張性
ML速度モデルを差し替えるだけで新規反応タイプを追加できる設計。
ケムインフォマティクス応用
適用先用途期待効果
lib/md反応性MDサイクル統合 (KIMMDYラッパー)共有結合変化を時間発展として解析可能
lib/molgen代謝・分解経路スコアラー生体内変換ペナルティを直接スコア化

既存 RMSDAnalyzer / HBondAnalyzer をKIMMDY出力トラジェクトリに適用することで、反応前後のコンフォメーション変化を統一的に解析できる。

本研究のインパクト
  • 古典MDと量子化学のあいだの長年のスケールギャップを実用レベルで橋渡し
  • コラーゲン酸化・DNA光損傷など生体高分子ダメージ研究の標準ツール候補
  • OSS公開 (graeter-group/kimmdy) によりコミュニティ拡張が即可能