Chat-Driven Computational (Bio)chemistry — LLM Agents for AMBER LEaP

Chat-Driven Computational (Bio)chemistry: Using LLM Agents to Accelerate Bio- and Chemoinformatics

J. Chem. Inf. Model. 2026, 66, 3397-3401 | Schott-Verdugo & Gohlke (HHU Düsseldorf) | DOI: 10.1021/acs.jcim.6c00633

LLMエージェントがAMBER LEaPの O(N²) ボトルネックと 32-bit オーバーフローを特定・修正。10倍以上の前処理高速化と数百万原子系への対応を実証した「バイブコーディング」実践Viewpoint。

背景と課題 — 計算化学コードの長寿化と最適化負債

AMBER をはじめとする MD スイートは数十年規模で開発が継続されており、設計当時の前提（小規模系・32-bit 整数）が現代のミリオン原子級シミュレーションに合わなくなっている。LEaP のユニットマージは O(N²) で、サイズ関連変数は 32-bit 整数で表現されているため、約 600 万原子で整数オーバーフローが起きていた。

既存課題1: 系を大きくすると前処理が二次的に伸び、巨大膜タンパク・粗視化モデルで実用的に使えない

既存課題2: 約 6×10⁶ 原子で 32-bit インデックスが破綻し、巨大系のパラメータ化自体が不可能

既存課題3: ドメイン知識(力場・トポロジ) とソフトウェア工学の両方を要する修正は人手では着手しにくい

→ 2025 年に SWE-Verified 性能が急伸した LLM エージェントを「対話的開発パートナー」として用い、計算化学コードを近代化できるかを示すのが本論文の狙い。

手法の概要 — エージェント協働による近代化フロー

AMBER コードベース全体をエージェント (Claude Code / Codex / Gemini CLI 等) に渡し対話的に走査
プロファイル情報＋著者の専門知識でホットスポットを示唆
エージェントが O(N²) ルーチンを再設計し低い計算複雑性のユニットマージへ書換え
32-bit 整数の系サイズ変数を 64-bit インデックスへ昇格
人間がレビュー＆既存テストで再現性を確認 (vibe coding スタイル)

本研究で示したこと

LLM エージェントは AMBER 規模の複数ファイルにまたがるコードを把握できる段階に到達
LEaP の O(N²) ユニットマージを低オーダー化し中規模系で 10 倍以上の前処理高速化
32-bit 整数を 64-bit へ昇格し、約 600 万原子の上限を解消
修正は AMBER 公式リポジトリへ貢献として統合 (実コミュニティ採用)
"vibe coding"（LLM が実装し人間がレビュー）が計算化学開発で実用フェーズへ

(a) LEaP 前処理時間のスケーリング比較

中規模系で 10× 以上 の改善。値は本文の定性記述に基づく概念曲線。

(b) 修正による主要メトリクス

≥ 10×

中規模系での LEaP 前処理速度向上

O(N²) → 低オーダー

ユニットマージの計算複雑性

32-bit → 64-bit

系サイズ関連インデックス

~6×10⁶ 原子上限撤廃

数百万分子・巨大膜系のパラメータ化が可能に

32-bit インデックスを 64-bit 化することで、巨大膜タンパク・複合粒子系・粗視化モデルの一括パラメータ化が可能に。

(d) Viewpoint が示す業界トレンド

年	出来事	含意
～2024	LLM はマルチファイル把握に難 / ハルシネーション頻発	計算化学コード実務には不十分
2025	SWE-Verified 性能が急伸 / Claude Code・Codex・Gemini CLI 普及	"vibe coding" が現実的に
2025末	Spotify が主力開発者のバイブコーディング移行を公表	産業界での先行採用
2026	本論文: AMBER LEaP の O(N²)+32-bit 問題を LLM が修正	計算化学 OSS への適用が viable

著者は「自然科学者が LLM エージェントと協働してレガシー研究ソフトを近代化する」開発スタイルが標準化しつつあると主張。

テイクホームメッセージ

レガシー最適化が現実的に

AMBER のように数十年蓄積されたコードでも、LLM エージェントが O(N²) ホットスポットを特定して低オーダー化できる段階。

数値表現の世代交代

32-bit インデックスの整数オーバーフローは計算化学界の隠れた天井だった。エージェントによる横断的書換えで一気に解消可能。

Vibe coding の規律

「LLM が実装、ヒトがレビュー」の役割分担が要点。テスト・プロバナンス管理を整えれば速度と品質を両立できる。

研究者の新たな役割

ドメイン知識を持つ研究者が「コードレビュー＆方向付け」で価値を出す時代へ。実装力よりも問題定義力が決定的。

計算化学パイプラインへの応用

lib/md (HBondAnalyzer / RMSDAnalyzer) でも O(N²) コンタクト計算が潜在 → 同手法で書換え候補
lib/fep の DockFEP / MMGBSAEngine セットアップスクリプト群を LLM エージェントで近代化
lib/molgen の JobManager における大規模 SMILES 処理での 32-bit カウンタ事故を予防
力場・トポロジ生成のドメイン特化最適化に LLM エージェントを「常駐レビュア」として組込

→ 自前パイプラインに対して、AMBER LEaP と同型の「ホットスポット特定 → 低オーダー化 → 64-bit 化」プレイブックが直接適用できる。

インパクト

計算化学 OSS の長寿命化を支える「LLM 共同開発」モデルの初期実証
巨大膜タンパク・粗視化系・薬剤–膜複合体など、これまで AMBER で前処理不能だった系が射程内に
研究者のスキルセットが「実装」から「設計監督・プロバナンス管理」へ移行する潮流を後押し