SARS-CoV-2 パンデミックを契機に COVID Moonshot 等の Open Science プロジェクトで Diamond Light Source の XChem 施設による大規模フラグメントスクリーニング(Mpro, NSP3 macrodomain, PLpro 等)が公開された。これらの汎コロナウイルス標的に対し、ドッキング・FEP・ML を含む多様な計算手法が乱立しているが、各論文は retrospective(事後評価) でベンチマークされており、訓練データへの過適合・選択バイアスの排除が困難。
→ 大規模コミュニティ参加のもと「実験結果を見ずに提出する」厳密ブラインド設定で、計算薬物発見の現状を測定する。
参加グループは任意の手法で 結合/非結合の二値分類 および pIC50 回帰値 を提出。締切後に X 線・SPR の真値を公開し集中採点。
ML 系スコアラーの AUROC が古典 docking を +0.10〜0.18 上回る傾向。コンセンサスがさらに +0.04 押し上げ。
絶対値予測は全手法で困難。±1 log unit 圏内に入る点は限定的。
| 標的 | ベスト系統 | 分類 AUROC | 難所 |
|---|---|---|---|
| Mpro | ML + 共有結合考慮 | ~ 0.82 | 共有結合性 warhead |
| NSP3 macrodomain | FEP / 物理 | ~ 0.70 | 水媒介 H 結合 |
| PLpro | ドッキング再採点 | ~ 0.68 | 浅いポケット |
| 3 標的合算 | Consensus | ~ 0.85 | — |
「銀の弾丸」は無し。標的の物理化学特性で勝ち筋が変わるため、複数手法を組み合わせる戦略が安定。
ドッキングと ML がほぼ同数で過半。FEP は計算コストの高さで提出は少なめだが NSP3 で存在感。
lib/docking 標準テストに追加し、UniDockRunner / ProLIFCalculator の回帰検証データに利用