Large Language Model Agent for Modular Task Execution in Drug Discovery
J. Chem. Inf. Model. | 2026 | DOI: 10.1021/acs.jcim.5c02454 | Ock & Barati Farimani (CMU)
LLMエージェントが創薬ワークフロー(取得→生成→75特性→改変→Boltz-2)を自律実行し、2ラウンドでQED>0.6が34→55(+61%)に増加
① 背景と課題

計算創薬の初期段階は 標的データ取得・文献調査・分子生成・ADMET評価・リード改変・3D結合予測 という多段ワークフローで構成される。各ステップは専門ツールに分散しており、結果の解釈と次手の設計は研究者の手作業に依存していた。

REINVENTやAutoMLは単一タスクには強いが、ステップ間の 推論ループ を自動化できない。
75を超えるADMET/物性指標を同時に多目的最適化する手段が不足。トレードオフ判定は人間の経験に依存。
最新文献の知見(標的・薬理・SAR)を分子設計にリアルタイムで取り込む仕組みが欠落。

→ LLMを「推論–実行–評価」のオーケストレータに据え、6モジュールを統一エージェントから自律呼び出しさせるアプローチを提案。

② エージェント構成(6モジュール)
LLM Agent オーケストレーション LLM Agent ①データ取得 NCBI/UniProt ②文献RAG PubMed/ChEMBL ③分子生成 REINVENT系 ④75特性予測 ADMETlab ⑤LLM改変 2 rounds ⑥Boltz-2 3D結合構造

LLMが推論し、必要なモジュールをツール呼び出し形式で逐次実行。出力をRAGコンテキストに注入して次サイクルへ。

③ 本研究で示したこと
  • 100分子の初期プールに対し 2ラウンドの自律改変ループ が完走
  • QED > 0.6 を満たす分子数: 34 → 55(+61%)
  • Ghoseフィルター適合数: 32 → 55(+72%)
  • Boltz-2 による標的への結合期待化合物割合が増加
  • RAG経由で 標的文献QA多目的最適化 を一連のエージェントが担う
  • 人間の手動介入なしでin silicoリード最適化サイクルが回ることを実証
(a) QED > 0.6 を満たす分子数の推移
2ラウンド改変による drug-likeness 改善 0 20 40 60 80 100 通過分子数 (out of 100) 34 初期プール ~45 Round 1 55 Round 2 +61%

出典: 本論文 (QED > 0.6 をパスする分子数) — 100分子プールに対する改変ループの効果。Round 1 は内挿表示。

(b) フィルター別 適合分子数の比較
QED と Ghose Filter の Initial vs Round 2 0 20 40 60 34 55 QED > 0.6 32 55 Ghose Filter Initial Round 2 Ghose: MW 400–480, logP −0.4–5.6, HBA≤10, HBD≤5
(c) 75特性 多目的評価の射影
代表6軸: Initial vs Round 2(正規化スコア 0–1) QED LogP Solubility SA score HBA/HBD TPSA Initial Round 2 ※ ADMETlab系75特性のうち代表6軸を示す模式図
(d) Boltz-2 構造評価とワークフロー規模
100 分子
初期プール(Round 0)
2 ラウンド
自律改変ループ(人間介入なし)
75 特性
同時評価(ADMETlab + 物性)
Boltz-2
3D タンパク質-リガンド構造 / 結合親和性予測
⑤ テイクホームメッセージ
統一オーケストレータとしてのLLM
NCBI/UniProt 取得から Boltz-2 構造評価まで、6モジュールを単一LLMが推論ベースで統合。専門家がワークフローを手書きする必要がない。
RAG による文献駆動型設計
PubMed/ChEMBL をベクトル化し、標的特異的な知識を改変提案にリアルタイム注入。最新SARを取り込んだリード最適化が可能に。
75特性同時最適化の自動化
ADMETlab系の多軸評価を改変ループに組込み、QED 0.6超が34→55、Ghose適合が32→55へ向上。多目的トレードオフをLLMが調停。
合成可能性と再現性の宿題
LLMが提案する化学修飾は合成容易性が未保証。確率的出力ゆえの再現性確保、in vitro 検証への接続が次の課題として残る。
計算化学パイプラインへの応用

lib/molgen × MCP化: JobManager / MolgenYaml をツール化し、LLMエージェントから「ジョブ投入→スコアラー切替→改変ラウンド」を自然言語で駆動。

lib/docking × Boltz-2 連携: UniDockRunner の前段に Boltz-2 構造予測を挿入し、共結晶のないターゲットでもリガンド配座生成→ドッキング検証へ。

lib/fep スクリーナ: ADMET 75特性を通過した分子のみ MMGBSAEngine / DockFEP に流す多目的ゲートを LLM 側で設定。

RAGスコアラー: ChEMBL/PubMed RAG を独立モジュール化し、lib/molgen のスコアラーから呼び出して文献駆動の reward 関数を構築。

インパクト
  • 専門家依存だった創薬ループを 自律エージェント化 する青写真を提示
  • QED 34→55, Ghose 32→55 と 定量的な多目的改善 をin silicoで実証
  • Boltz-2 と RAG を組合せ、3D構造評価まで含む end-to-end ワークフローを示した