Navigating Structure-Based Drug Discovery

Navigating Structure-Based Drug Discovery with Physics- and Knowledge-Based Approaches

Lam & Katritch — npj Drug Discovery 2025 | DOI: 10.1038/s44386-025-00031-4 | USC

🗺️ 物理ベース vs 知識ベースを4軸（精度・速度・合成可能性・汎化性）で整理し、ハイブリッド統合の優位性を実証

① 4軸フレームワーク

② ベンチマーク結果

~1 kcal/mol

FEP+の達成可能精度（ベストプラクティス厳守時）

③ データリーク問題

PDBbind Core SetでPearson相関0.77と報告されていたモデルが、proper stratification（90% BLAST類似度除去）で0.46に低下。

CrossDocked・DUD-Eも類似バイアスあり。見かけ上の汎化性が水増しされていた

解決策: PLINDER-PL50（449K系）、PoseBusters（308複合体）、Runs N' Posesなど非汚染ベンチマークの活用

知識ベース手法の評価はこれらの非汚染データセットで再検証が必須

④ 主要手法マップ

FEP (RBFE)
Ross et al.: 実験限界 ~1 kcal/molへ到達。マクロサイクル・電荷変化も対応。

DiffDock / SurfDock
拡散モデルでポーズサンプリング。非物理的ポーズ→PoseBusters検証が必須。

GNINA (CNN Rescoring)
VinaPose + CNN/GNN再スコアリング。CACHE#1トップ。ハイブリッドの典型例。

V-SYNTHES / AutoGrow4
SMARTS反応制約で合成可能化合物のみ生成。CB2で33%ヒット率達成。

⑤ AlphaFold2活用の現状

AF2アポ構造でのドッキング: 高信頼度ターゲットでは実験構造と同等（Lyu et al.）。低信頼度では大幅に劣る。

AF3・Boltzのco-foldingでも既知リガンド-ポケット類似性への強い依存が残る（Runs N' Poses）

実用的結論:

⑥ lib/docking・lib/fep・lib/molgen 実装優先度

最重要インサイト:

単一手法より物理+知識のハイブリッドが安定して最良

合成可能性制約なし生成は実用上致命的欠陥