BioChemAIgent: MCP基盤の創薬AIエージェントフレームワーク
Yousefi, Bonn et al. (bioRxiv 10.64898/2025.12.17.694892) · Univ. Medical Center Hamburg-Eppendorf · machine_learning
🎯 専門知識不要の単一インターフェースから、小分子解析・タンパク質モデリング・
ドッキング・相互作用解析・可視化をエンドツーエンドで自動実行
① 背景と課題 — 断片化した計算化学エコシステム

分子ドッキング1タスクでさえ、リガンド前処理→プロトネーション→タンパク質修復→Grid定義→実行→相互作用抽出→可視化という多段階のツール操作が必要で、専門知識なしには実行困難。

汎用LLMはドッキング手順の深い専門知識を持たず、複数ツール連携タスクで精度低下
既存ツール(Vina, DiffDock等)は単体では優秀だが、シームレスな統合インターフェースがない

→ ドメイン特化知識をMCPドキュメントに実装してLLMのツール選択を正確に誘導

② システムアーキテクチャ(クライアント-サーバ-MCP)
LLM Client
OpenAI / OpenRouter
Ollama
(Python 3.11)
ChEMBL-MCP-Server
ChEMBL化合物DB
検索・取得
PDB-MCP-Server
PDB構造
ダウンロード・解析
BioChemAIgent-MCP-Server
27ツール / 19パッケージ
小分子解析・タンパク質モデリング
ドッキング・相互作用・可視化

tool callループ: クエリ → LLM → tool call → 実行 → 結果返却 → LLMが最終回答

RDKit OpenBabel ADMET-AI ESM3 AlphaFold3 PropKA/PDB2PQR FoldX AutoDock Vina Smina Gnina DiffDock PLIP py3Dmol Plotly
③ 小分子解析モジュール
SMILES → 立体異性体生成(RDKit)
↓ 3D構造生成(OpenBabel ETKDG)
↓ プロトネーション(OpenBabel, pH指定)
↓ MW / LogP / TPSA / ADMET予測(ADMET-AI)

SDF ↔ PDB ↔ SMILES 相互変換も対応

④ タンパク質モデリングモジュール
  • ESM3: 配列→構造予測・機能予測
  • AlphaFold3: モノマー/マルチマー/リガンド複合体予測
  • PropKA + PDB2PQR: pH指定プロトネーション
  • FoldX: 側鎖修復・エネルギー最小化

実験構造なし標的もAF3で対応可能

⑤ ドッキング + 相互作用解析モジュール(5エンジン統合)
物理ベース
AutoDock Vina(標準)
Smina(カスタムスコア)
Gnina(CNNスコア)
→ PDBQT前処理が必要
深層学習ベース
DiffDock(拡散モデル)
AlphaFold3(配列→複合体)
→ SDF/配列のみで対応可

PLIP相互作用抽出: HBond / 疎水性 / 塩橋 / π-π / ハロゲン / 水橋 / カチオン-π / 金属配位 の8種類を自動同定。py3Dmol + Plotlyで可視化。

⑥ 評価結果 — 2段階ベンチマーク
自動評価(LLMベース)
ツール呼び出し問題 + ロードマップ設計問題
文法・スペルを意図的破損した質問にも正答
GPT-5が全LLM中最高スコア
専門家評価(人間)
4種の複合ドラッグ発見シナリオ
暗黙的タスク推論でも高精度回答
全評価基準で期待水準を完全達成

ケーススタディ: COX-1 + イブプロフェンドッキングで必須相互作用(Arg120 イオン結合)を最上位ポーズで正確に再現

ケムインフォパイプラインへの応用
適用先ユースケース優先
lib/dockingSmina/Gnina/DiffDock を UniDockRunner 追加バックエンドとして統合High
lib/dockingProLIFCalculatorにPLIP統合(塩橋・π-π・水橋を追加)High
lib/molgenADMET-AIをMolgenYamlスコアラーに組み込みADMETフィルタリング自動化Med
lib/dockingESM3/AlphaFold3 APIで実験構造なし標的に対応Med
インパクト・限界・公開情報
  • 専門知識不要の統合創薬AIエージェントを実現
  • 5種ドッキングエンジンの自動選択で適用範囲を最大化
  • コミュニティ拡張可能なMCPレジストリで持続的発展
GPT-5以外では性能が大幅低下(汎用LLMの限界)
MDシミュレーション統合なし — 静的ドッキング特化

🔗 github.com/imsb-uke/bcai
🌐 bcai.ims.bio