既存の SBDD ベンチマーク(PDBbind・CASF・DUD-E)は結合親和性・ポーズ精度に特化しており、実際の創薬キャンペーンで不可欠な選択性・成薬性・合成可能性は評価されていなかった。この「評価ギャップ」により、親和性で高スコアな手法が実践的な創薬では機能しないケースが見逃されてきた。
→ 15 手法を Docker 標準環境で統一再実装し、5 軸評価フレームワークで公平比較
Docker 標準環境で全手法を統一再実装・実行—再現性確保
| カテゴリ | 代表手法 |
|---|---|
| 深層学習ドッキング | DiffDock, DiffDock-L |
| 物理ベース | Vina, AutoDock-GPU, Glide |
| 親和性予測 | 複数 GNN/CNN 手法 |
| ポケット検出 | 複数ディープラーニング手法 |
→ 最新 PDB(2023 年以降)+ MoleculeNet 実験活性データで評価
| 評価軸 | 物理ベース | 深層学習 |
|---|---|---|
| 親和性 Pearson | 中 | 高 |
| ポーズ精度 | 中 | 高 |
| 選択性 | 安定 | 不安定 |
| 合成アクセス性 | 高 | 低い傾向 |
| 計算 ADMET | 高 | 低い傾向 |
| ベンチマーク | 親和性 | 選択性 | ADMET | 合成 |
|---|---|---|---|---|
| PDBbind | ✓ | ✗ | ✗ | ✗ |
| CASF | ✓ | ✗ | ✗ | ✗ |
| DUD-E | △ | ✗ | ✗ | ✗ |
| 本論文 | ✓ | ✓ | ✓ | ✓ |