近年、DiffDock などの拡散モデル系MLドッキングが注目されているが、GPCRのような薬剤標的での実用性は未確立。さらに、専門知のあるVSプロトコル設計(プロトン化・グリッド・デコイ生成等)はヒューマンボトルネックであり、再現性が低い。
Claude Code(LLMエージェント)に高レベル指示のみを与え、データ収集→前処理→ドッキング→統計検定までを自律実装させた。
FPR2 GPCR において、物理ベースドッキング(Uni-Dock)が拡散モデル(DiffDock)を統計的に有意に上回ることを、LLMエージェントが自律設計したベンチマークで初めて定量化。Uni-Dockは ROC AUC 0.70–0.73 に達し、DiffDockは AUC 0.54–0.56 でほぼランダム識別。エキスパートガイド設定はnaive設定よりUni-Dock AUCを +0.020 改善(DeLong p=0.003)。再ドッキングRMSDではUni-Dock crystal mode 0.22–0.39Å に対し DiffDock は 23–29Å と大きく劣化、GPCRが拡散モデルの訓練データで過小代表されることが示唆された。