近年の DL ドッキング手法(DiffDock/Chai-1/AF3 等)は結晶構造既知・ポケット指定という非現実的な条件でのみ評価されることが多く、実創薬への適用性が不明確だった。
→ PoseBench: 4データセット × 11手法 × 統一 apo 条件で包括的ベンチマークを実施
アミノ酸別タンパク質-リガンド相互作用フィンガープリント(PLIF)の予測精度を Wasserstein 距離で評価する新規指標。
RMSD だけでは「位置は合っているが相互作用が違う」偽陽性ポーズを検出できない問題を解決
| 手法 | RMSD≤2Å+PB-Valid | PLIF-WM |
|---|---|---|
| P2Rank+Vina | 57.5% | ~68% |
| DiffDock-L | 57.5% | ~64% |
| Chai-1 | 77.8% | ~77% |
| AF3 | 77.4% | ~74% |
| Boltz-1 | 71.8% | ~71% |
| 手法 | RMSD≤2Å+PB-Valid | PLIF-WM |
|---|---|---|
| P2Rank+Vina | 3.7% | ~62% |
| DiffDock-L | 1.3% | ~60% |
| Chai-1 | 15.0% | ~60% |
| AF3 | 28.0% | ~59% |
| Boltz-1 | 14.0% | ~60% |
| 手法 | MSAあり | MSAなし |
|---|---|---|
| AF3 | 64.3% | 40.5% |
| Boltz-1 | 56.8% | 57.6% |
| Chai-1 | 57.6% | 57.9% |
AF3 は MSA なしで -24pp。Chai-1/Boltz-1 はほぼ変化なし。ESM2 が MSA を代替
→ 訓練データ(PDB)の偏りを反映した系統的弱点
| 適用先 | 提案 |
|---|---|
| lib/docking | PLIF-WM / PB-Valid を UniDockRunner 後処理に統合 |
| lib/docking | DockGen-E で社内パイプラインの定期汎化テスト |
| lib/docking | Chai-1 Single-Seq モードで MSA コスト削減 VS |
| lib/md | DL 予測構造の MD relaxation 品質を PB-Valid で判定 |