Chat-Driven Computational (Bio)chemistry: Using LLM Agents to Accelerate Bio- and Chemoinformatics
J. Chem. Inf. Model. 2026, 66, 3397-3401 | Schott-Verdugo & Gohlke (HHU Düsseldorf) | DOI: 10.1021/acs.jcim.6c00633
LLMエージェントがAMBER LEaPの O(N²) ボトルネックと 32-bit オーバーフローを特定・修正。10倍以上の前処理高速化と数百万原子系への対応を実証した「バイブコーディング」実践Viewpoint。
背景と課題 — 計算化学コードの長寿化と最適化負債

AMBER をはじめとする MD スイートは数十年規模で開発が継続されており、設計当時の前提(小規模系・32-bit 整数)が現代のミリオン原子級シミュレーションに合わなくなっている。LEaP のユニットマージは O(N²) で、サイズ関連変数は 32-bit 整数で表現されているため、約 600 万原子で整数オーバーフローが起きていた。

既存課題1: 系を大きくすると前処理が二次的に伸び、巨大膜タンパク・粗視化モデルで実用的に使えない
既存課題2: 約 6×10⁶ 原子で 32-bit インデックスが破綻し、巨大系のパラメータ化自体が不可能
既存課題3: ドメイン知識(力場・トポロジ) とソフトウェア工学の両方を要する修正は人手では着手しにくい

→ 2025 年に SWE-Verified 性能が急伸した LLM エージェントを「対話的開発パートナー」として用い、計算化学コードを近代化できるかを示すのが本論文の狙い。

手法の概要 — エージェント協働による近代化フロー
  • AMBER コードベース全体をエージェント (Claude Code / Codex / Gemini CLI 等) に渡し対話的に走査
  • プロファイル情報+著者の専門知識でホットスポットを示唆
  • エージェントが O(N²) ルーチンを再設計し低い計算複雑性のユニットマージへ書換え
  • 32-bit 整数の系サイズ変数を 64-bit インデックスへ昇格
  • 人間がレビュー&既存テストで再現性を確認 (vibe coding スタイル)
著者×LLMエージェント協働ループ 著者(Domain) LLM Agent Claude/Codex/Gemini AMBER repo Patch (merge+64bit) human review & iterate プロファイル指示 マルチファイル把握
本研究で示したこと
  • LLM エージェントは AMBER 規模の複数ファイルにまたがるコードを把握できる段階に到達
  • LEaP の O(N²) ユニットマージを低オーダー化し中規模系で 10 倍以上の前処理高速化
  • 32-bit 整数を 64-bit へ昇格し、約 600 万原子の上限を解消
  • 修正は AMBER 公式リポジトリへ貢献として統合 (実コミュニティ採用)
  • "vibe coding"(LLM が実装し人間がレビュー)が計算化学開発で実用フェーズへ
(a) LEaP 前処理時間のスケーリング比較
系サイズ vs 前処理時間(概念図) ≧10× 高速化 ~6×10⁶ 原子(旧32-bit上限) 旧 LEaP : O(N²) merge + 32-bit LLMエージェント修正版: 低オーダー + 64-bit 系サイズ N (原子数) → 前処理時間

中規模系で 10× 以上 の改善。値は本文の定性記述に基づく概念曲線。

(b) 修正による主要メトリクス
≥ 10×
中規模系での LEaP 前処理速度向上
O(N²) → 低オーダー
ユニットマージの計算複雑性
32-bit → 64-bit
系サイズ関連インデックス
~6×10⁶ 原子 上限撤廃
数百万分子・巨大膜系のパラメータ化が可能に
(c) 整数幅の昇格と扱える系サイズ
扱える最大原子数(イメージ比較) 32-bit 旧版 ~6.0M 原子で破綻 64-bit 修正版 ≫ 10⁹ 数百万分子系で実用 変更前 変更後

32-bit インデックスを 64-bit 化することで、巨大膜タンパク・複合粒子系・粗視化モデルの一括パラメータ化が可能に。

(d) Viewpoint が示す業界トレンド
出来事含意
~2024LLM はマルチファイル把握に難 / ハルシネーション頻発計算化学コード実務には不十分
2025SWE-Verified 性能が急伸 / Claude Code・Codex・Gemini CLI 普及"vibe coding" が現実的に
2025末Spotify が主力開発者のバイブコーディング移行を公表産業界での先行採用
2026本論文: AMBER LEaP の O(N²)+32-bit 問題を LLM が修正計算化学 OSS への適用が viable

著者は「自然科学者が LLM エージェントと協働してレガシー研究ソフトを近代化する」開発スタイルが標準化しつつあると主張。

テイクホームメッセージ
レガシー最適化が現実的に

AMBER のように数十年蓄積されたコードでも、LLM エージェントが O(N²) ホットスポットを特定して低オーダー化できる段階。

数値表現の世代交代

32-bit インデックスの整数オーバーフローは計算化学界の隠れた天井だった。エージェントによる横断的書換えで一気に解消可能。

Vibe coding の規律

「LLM が実装、ヒトがレビュー」の役割分担が要点。テスト・プロバナンス管理を整えれば速度と品質を両立できる。

研究者の新たな役割

ドメイン知識を持つ研究者が「コードレビュー&方向付け」で価値を出す時代へ。実装力よりも問題定義力が決定的。

計算化学パイプラインへの応用
  • lib/md (HBondAnalyzer / RMSDAnalyzer) でも O(N²) コンタクト計算が潜在 → 同手法で書換え候補
  • lib/fep の DockFEP / MMGBSAEngine セットアップスクリプト群を LLM エージェントで近代化
  • lib/molgen の JobManager における大規模 SMILES 処理での 32-bit カウンタ事故を予防
  • 力場・トポロジ生成のドメイン特化最適化に LLM エージェントを「常駐レビュア」として組込

→ 自前パイプラインに対して、AMBER LEaP と同型の「ホットスポット特定 → 低オーダー化 → 64-bit 化」プレイブックが直接適用できる。

インパクト
  • 計算化学 OSS の長寿命化を支える「LLM 共同開発」モデルの初期実証
  • 巨大膜タンパク・粗視化系・薬剤–膜複合体など、これまで AMBER で前処理不能だった系が射程内に
  • 研究者のスキルセットが「実装」から「設計監督・プロバナンス管理」へ移行する潮流を後押し