Boltz-2(MIT/Recursion)はタンパク質-リガンド結合予測のための深層学習モデルとして注目を集めたが、大規模な第三者独立評価は存在しなかった。開発者の自己評価のみでは実際の仮想スクリーニング環境での性能を正確に把握できず、実務適用判断が困難だった。
→ ホールドアウト16,780件 + 最新PDB21,702件で汎化性を厳密に二段階検証
評価指標:RMSD(結合ポーズ精度)・成功率(RMSD < 2Å)・Pearson相関係数(親和性予測)・計算時間・GPU使用量。比較対象:Glide・Vina・DiffDockも含む包括的比較。
大規模スクリーニング(10万件以上)には計算コストが障壁。ポーズ精度が必要な精密評価ステージでの利用を推奨。
| 手法 | 成功率 | Pearson r | コスト |
|---|---|---|---|
| Vina | 32% | 0.22 | 低 |
| Glide | 55% | 0.38 | 中 |
| DiffDock | 48% | 0.35 | 中 |
| Boltz-2 (Hold) | 65% | 0.50 | 高 |
| Boltz-2 (PDB) | 45%⚠ | 0.42 | 高 |
新規構造では従来DiffDock並。コスト対効果を慎重に評価すること
lib/docking に Boltz-2 ラッパーを追加し、UniDockRunner と並行評価できる統一インターフェース設計を検討