AGAPI-Agents: An Open-Access Agentic AI Platform for Accelerated Materials Design on AtomGPT.Org
Lee, Choudhary et al. (Johns Hopkins University) — arXiv:2512.11935 [cs.AI] Dec 2025 · 1,000+ active users
🎯 OSSモデル8種+材料科学API20以上をAPESパイプラインで統合:商用LLM不要の自律材料設計
① 背景と課題

ChemCrow・Coscientistなどの科学AIエージェントは成果を示しているが、商用LLM依存・単一ドメイン・再現性欠如という3つの根本的課題を抱える。

GPT-4等の商用LLMへの依存:コスト・非決定性・IP懸念が研究利用の障壁になる
単一ドメイン特化:材料科学の多様性(ハードマター/ソフトマター)を一つのシステムでカバーできない
再現性の欠如:モデル更新による挙動変化・全クエリロギングなしでは科学的再現性を担保できない

→ AGAPI:8種OSSモデル+温度=0+バージョン固定でこれら3課題を同時解決

② APES アーキテクチャ
Agent: 自然言語クエリ解釈 → ツール選択

Planner: サブタスクグラフ生成(依存関係付き)

Executor: 非同期API呼び出し(リトライ・レート制限管理)

Summarizer: 結果集約・物理整合性検証・可視化出力

例:「GaN→Al置換→ALIGNN-FF最適化→XRD→バンド構造」の10ステップワークフローを自然言語1文から自動生成・実行

③ 統合リソース

データベース: JARVIS-DFT, Materials Project, AFLOW, OQMD, PDB, NIH-CACTUS

MLモデル: ALIGNN(物性予測), ALIGNN-FF(力場), SlaKoNet(バンド構造), DiffractGPT(XRD), ESMFold(タンパク質)

20+ API
OpenAPI 3.1準拠・同期/非同期両モード対応
④ OSSモデルベンチマーク (TPS)
モデルTPS対ベースライン
Llama-3.2-90B (baseline)36.11.00×
Kimi-K253.31.48×
Qwen3-Next-80B95.82.66×
GPT-OSS-120B122.33.39×
GPT-OSS-20B (default)141.73.93×
④ 負荷テスト結果
16.641s
1000同時ユーザーでの平均レスポンス時間(現状)
目標: <2s
水平スケーリング・モデル最適化で達成予定
1,000+
アクティブユーザー数(公開数ヶ月で達成)
④ 限界点
  • ピーク時レスポンス16.6秒は対話性に難あり
  • ハルシネーション減少の定量評価値が未報告
  • 低分子ドッキング/FEPへの統合は限定的
  • ビジョンモデルの分散が大きく安定性に課題
⑤ テイクホームメッセージ
🆓 商用LLM不要の実用プラットフォーム
8種OSSモデルをベンチマーク比較し最適なデフォルトを選定。コスト・IP懸念なしで科学ワークフローを実行可能。
🔬 10ステップ自動ワークフロー
自然言語1文からGaN材料探索→Al置換→力場最適化→XRD→バンド構造まで全自動実行。
📊 再現性設計の徹底
温度=0・モデルバージョン固定・全I/Oロギングで同一クエリから同一結果を保証。商用APIの非決定性問題を回避。
🌐 AtomGPT.orgで即日利用可能
Webチャット・Python API・音声入力に対応。1000名以上が既に活用中。OSS: github.com/atomgptlab/agapi
ケムインフォマティクスへの応用
適用先ユースケース
lib/dockingAPES移植で自然言語→UniDock+ProLIF自動実行
lib/molgenマルチモデル比較でMolgen生成物の品質評価
lib/mdOpenAPI 3.1準拠でMDツールをAPIサービス化

温度=0・バージョン固定の再現性設計は全libで採用価値あり

本研究のインパクト
  • OSSモデルで商用LLMと同等の科学ワークフロー自動化を実証
  • 材料科学APEsの設計パターンを創薬パイプラインに転用可能
  • 1000ユーザー規模での実用性を実証した実践的プラットフォーム