Navigating Structure-Based Drug Discovery with Physics- and Knowledge-Based Approaches
Lam & Katritch — npj Drug Discovery 2025 | DOI: 10.1038/s44386-025-00031-4 | USC
🗺️ 物理ベース vs 知識ベースを4軸(精度・速度・合成可能性・汎化性)で整理し、ハイブリッド統合の優位性を実証
① 4軸フレームワーク
物理ベース知識ベース
精度FEP ~1 kcal/molGNINA CACHE#1 top
速度FEP: 数百化合物億〜10B化合物対応
合成可能性設計外(要注意)SMARTS制約で制御
汎化性力場依存・制限ありデータリーク問題
結論: ハイブリッドワークフローが
CACHE・D3R・CASFで一貫してトップ
② ベンチマーク結果
ベンチマーク最良手法結果
V-SYNTHES (CB2)階層的VS33% ヒット率
V-SYNTHES (ROCK1)階層的VS28.5% ヒット率
Deep DockingActive Learning8.5% (4.1B化合物)
CACHE #1GNINA3.7% ヒット率
D3R GC4 (BACE1)ハイブリッドτ < 0.4
~1 kcal/mol
FEP+の達成可能精度(ベストプラクティス厳守時)
③ データリーク問題

PDBbind Core SetでPearson相関0.77と報告されていたモデルが、proper stratification(90% BLAST類似度除去)で0.46に低下。

CrossDocked・DUD-Eも類似バイアスあり。見かけ上の汎化性が水増しされていた
解決策: PLINDER-PL50(449K系)、PoseBusters(308複合体)、Runs N' Posesなど非汚染ベンチマークの活用

知識ベース手法の評価はこれらの非汚染データセットで再検証が必須

④ 主要手法マップ
FEP (RBFE)
Ross et al.: 実験限界 ~1 kcal/molへ到達。マクロサイクル・電荷変化も対応。
DiffDock / SurfDock
拡散モデルでポーズサンプリング。非物理的ポーズ→PoseBusters検証が必須。
GNINA (CNN Rescoring)
VinaPose + CNN/GNN再スコアリング。CACHE#1トップ。ハイブリッドの典型例。
V-SYNTHES / AutoGrow4
SMARTS反応制約で合成可能化合物のみ生成。CB2で33%ヒット率達成。
⑤ AlphaFold2活用の現状

AF2アポ構造でのドッキング: 高信頼度ターゲットでは実験構造と同等(Lyu et al.)。低信頼度では大幅に劣る。

AF3・Boltzのco-foldingでも既知リガンド-ポケット類似性への強い依存が残る(Runs N' Poses)

実用的結論:

  • 実験ホロ構造 > AF2アポ > ホモロジーモデル の順
  • クライオEM構造はLIVQ/DAQスコアで局所品質を事前確認
  • co-folding後は必ずPoseBusters検証
⑥ lib/docking・lib/fep・lib/molgen 実装優先度
  • UniDockRunnerに階層的VSモード追加(MEL→反復展開)— HIGH
  • ProLIFCalculatorにCNN/GNNリスコアリングフック実装 — HIGH
  • DockFEPにPoseBusters前処理ステップ追加 — MEDIUM
  • MolgenYamlにSMARTS反応テンプレート制約フィールド — MEDIUM
  • Thompson SamplingによるアクティブラーニングVS — MEDIUM
最重要インサイト:
  • 単一手法より物理+知識のハイブリッドが安定して最良
  • 合成可能性制約なし生成は実用上致命的欠陥