ChemSpace Copilot — Agentic AI for Interactive Visualization & Exploration of Chemical Space

DOI 10.26434/chemrxiv.15000527 ・ ChemRxiv preprint ・ 2026-03 ・ Orlov, Volkov, Milova, Horvath, Varnek (Univ. de Strasbourg) ・ Category machine_learning
[GOAL] GTM 化学空間可視化 × LLM エージェントを ReAct 型で結合し、ChEMBL 取得 → ケモタイプ解析 → 分子生成 → 合成計画を 1 つのチャット UI で完結させる non-expert 向け end-to-end 探索基盤。

1背景と課題

従来のケモグラフィツール(GTM-Explorer, DataWarrior 等)は、パラメータ調整・マップ解釈・後段の生成/合成計画への橋渡しを 手動かつ専門家依存で行う必要があり、医化学者・実験家にとって心理的・操作的なハードルが高かった。

  • 専門ツールが探索・生成・合成で 分断されている
  • 非専門家は GTM のハイパー設定や活性崖の読みで詰まる
  • 生成結果を化学空間上で 位置づける統一 UI が無い

2手法の概要

ReAct 型 LLM エージェントが モジュラー Toolkit を呼び分け、GTM マップ上で対話的に探索を進める。 生成(REINVENT, MolGPT 等)と合成計画(AiZynthFinder 等)を同じエージェント基盤に登録。

  • ToolChEMBL fetch / GTM fit & project
  • ToolChemotype clustering & activity-cliff
  • ToolGenerative model (REINVENT / MolGPT)
  • ToolRetrosynthesis (AiZynthFinder)

3本研究で示したこと

  • Demo 1ChEMBL ターゲット化合物を GTM 上で可視化し活性クラスターを抽出
  • Demo 2マップの指定領域に対する focused 分子生成を自然言語で発火
  • Demo 3生成候補に対する レトロ合成計画を同 UI で評価

end-to-end の Explore → Generate → Synthesize ループが 単一チャットインタフェースで動くことを定性的に実証。

4主な結果(4 パネル)

aAgent Architecture (ReAct ループ)

User (NL prompt) LLM Agent ReAct: Reason → Act Plan / Tool select ChEMBL fetch GTM fit / project Generative (REINVENT) AiZynthFinder GTM map viewer (UI) observation → next step
User の自然言語 prompt から ReAct 型 LLM が Toolkit を逐次選択し、観測結果を次思考に戻す。

bToolkit カバレッジ(タスク種別)

0 25 50 75 100 % of demo workflow steps covered ChEMBL fetch ~30% GTM fit/project ~90% Chemotype分析 ~70% Generative ~40% Retrosynthesis ~20% Reporting ~50% Quant. eval 未実施
3 デモタスクで実行された Toolkit 比率を概算プロット。GTM 周辺が中心、定量ベンチマークは未実施。

cGTM マップ上のクラスタと生成ターゲット領域

GTM latent dim 1 GTM latent dim 2 Cluster A (active, pIC50 ≈ 8) Cluster B (inactive) Cluster C (selective) Focused gen. region (Demo 2) low high pIC50
活性クラスター A を視覚化し、ユーザー指定の橙破線領域に対し focused 生成(▲: 生成分子)を実行。

dExplore → Generate → Synthesize ファネル

ChEMBL 取得 + GTM 投影 ~10,000+ cmpds 活性クラスター抽出 ~100 cmpds / cluster Focused generation 10 候補 / 1 命令 Retro 合成計画(per-cand.) Tool: ChEMBL+GTM Tool: chemotype Tool: REINVENT Tool: AiZynthFinder
単一チャット UI で 4 段ファネルを連結。各層で異なる Tool を ReAct エージェントが自動選択。

5テイクホームメッセージ

ChemSpace Copilot は、解釈可能な GTM 化学空間を ReAct 型 LLM エージェントの「キャンバス」として採用し、 ChEMBL 取得・ケモタイプ解析・分子生成・合成計画を 1 つのチャット UI に集約。 探索→生成→合成検証ループの 非専門家アクセスを一気に下げる先行実装で、 我々の lib/molgen + lib/docking 統合ダッシュボードの設計指針として直接転用可能(GTM 大規模化と化学的判断の信頼性は今後の検証課題)。