LLM Agent for Modular Task Execution in Drug Discovery

Large Language Model Agent for Modular Task Execution in Drug Discovery

J. Chem. Inf. Model. | 2026 | DOI: 10.1021/acs.jcim.5c02454 | Ock & Barati Farimani (CMU)

LLMエージェントが創薬ワークフロー（取得→生成→75特性→改変→Boltz-2）を自律実行し、2ラウンドでQED>0.6が34→55（+61%）に増加

① 背景と課題

計算創薬の初期段階は 標的データ取得・文献調査・分子生成・ADMET評価・リード改変・3D結合予測 という多段ワークフローで構成される。各ステップは専門ツールに分散しており、結果の解釈と次手の設計は研究者の手作業に依存していた。

REINVENTやAutoMLは単一タスクには強いが、ステップ間の 推論ループ を自動化できない。

75を超えるADMET/物性指標を同時に多目的最適化する手段が不足。トレードオフ判定は人間の経験に依存。

最新文献の知見（標的・薬理・SAR）を分子設計にリアルタイムで取り込む仕組みが欠落。

→ LLMを「推論–実行–評価」のオーケストレータに据え、6モジュールを統一エージェントから自律呼び出しさせるアプローチを提案。

② エージェント構成（6モジュール）

LLMが推論し、必要なモジュールをツール呼び出し形式で逐次実行。出力をRAGコンテキストに注入して次サイクルへ。

③ 本研究で示したこと

(a) QED > 0.6 を満たす分子数の推移

出典: 本論文 (QED > 0.6 をパスする分子数) — 100分子プールに対する改変ループの効果。Round 1 は内挿表示。

(b) フィルター別適合分子数の比較

(d) Boltz-2 構造評価とワークフロー規模

100 分子

初期プール（Round 0）

2 ラウンド

自律改変ループ（人間介入なし）

75 特性

同時評価（ADMETlab + 物性）

Boltz-2

3D タンパク質-リガンド構造 / 結合親和性予測

⑤ テイクホームメッセージ

統一オーケストレータとしてのLLM
NCBI/UniProt 取得から Boltz-2 構造評価まで、6モジュールを単一LLMが推論ベースで統合。専門家がワークフローを手書きする必要がない。

RAG による文献駆動型設計
PubMed/ChEMBL をベクトル化し、標的特異的な知識を改変提案にリアルタイム注入。最新SARを取り込んだリード最適化が可能に。

75特性同時最適化の自動化
ADMETlab系の多軸評価を改変ループに組込み、QED 0.6超が34→55、Ghose適合が32→55へ向上。多目的トレードオフをLLMが調停。

合成可能性と再現性の宿題
LLMが提案する化学修飾は合成容易性が未保証。確率的出力ゆえの再現性確保、in vitro 検証への接続が次の課題として残る。

計算化学パイプラインへの応用

lib/molgen × MCP化: JobManager / MolgenYaml をツール化し、LLMエージェントから「ジョブ投入→スコアラー切替→改変ラウンド」を自然言語で駆動。

lib/docking × Boltz-2 連携: UniDockRunner の前段に Boltz-2 構造予測を挿入し、共結晶のないターゲットでもリガンド配座生成→ドッキング検証へ。

lib/fep スクリーナ: ADMET 75特性を通過した分子のみ MMGBSAEngine / DockFEP に流す多目的ゲートを LLM 側で設定。

RAGスコアラー: ChEMBL/PubMed RAG を独立モジュール化し、lib/molgen のスコアラーから呼び出して文献駆動の reward 関数を構築。

インパクト