Evaluating Ligand Docking for Drugging PPIs: Insights from AlphaFold2 and MD Refinement
Gómez Borrego & Torrent Burgas — J. Cheminformatics 2025, 17:144 (DOI: 10.1186/s13321-025-01067-4) | Open Access
🎯 16 PPI系×8ドッキング×5構造ソースを系統評価。AF2はPDB同等。TankBind_local/Glideが最良。ドラッガビリティ別推薦表を確立
① 背景: PPI ドッキングの課題

PPI は癌・神経変性・感染症での有望標的だが、広くフラットな接触面・ドラッガブル部位の不明確さ・実験構造データの不足が難しさの原因。AF2 登場で PPI 構造予測は大幅改善されたが、PPI 特化のドッキングベンチマークは存在しなかった。

ChEMBL/2P2Idb → 16 PPI 系 (1185 化合物)

5 構造ソース × 8 ドッキングプロトコル

AUROC / EF1% 比較

→ MDM2/p53・KRAS/SOS1・BRD4/H4 等を含む 16 系(タンパク質-タンパク質 8 件 + タンパク質-ペプチド 8 件)

② 構造ソース 5 種
  • PDB: 実験結晶構造(holo)
  • AF2nat: PDB 配列から AF2 2.3.1 で予測
  • AF2full: 全長タンパク質から AF2 予測
  • MD-PDB: PDB → 500 ns MD → 10 代表
  • MD-AF: AF2nat → 500 ns MD → 10 代表
  • AlphaFlow: 深層学習コンフォメーション生成 → 10 代表
③ 8 ドッキングプロトコル
ツールタイプ
TankBind_localDL・局所
Glide従来・局所
AutoDock Vina従来・局所
GninaML・局所
Glide-IFD従来・Induced Fit
TankBind_blindDL・ブラインド
EquiBindDL・ブラインド
DiffDockDL・ブラインド
④ 主要発見 (a) AF2 ≈ PDB
AF2 ≈ PDB
AUROC に統計的有意差なし(16 PPI 系全体)

AF2 モデルは native PDB 構造の代替として有効。実験構造が入手不能な PPI ターゲットでも AF2 を利用可能。

④ 主要発見 (b) 局所 > ブラインド

TankBind_local と Glide が全構造ソースを通して最良の EF1% と AUROC を達成。

局所 > ブラインド
特にタンパク質-タンパク質系で顕著

DiffDock 等のブラインド DL は moderately druggable ポケットで相対的に有利

④ 主要発見 (c) MD/AlphaFlow の効果

アンサンブル精製は局所的に大幅改善するが変動が大きい。

10 コンフォメーション間 AUROC の変動が非常に大きく、最良コンフォメーションの事前予測は困難
Induced Fit Docking(Glide-IFD)は通常 Glide と有意差なし
④ ドラッガビリティ別推薦(Table 3)
ドラッガビリティ推薦ツール
SiteScore > 0.8, Dscore > 0.75Glide, TankBind_local
Dscore 0.5–0.75Glide-IFD, DiffDock
Dscore < 0.5TankBind_blind, DiffDock
不明/クリプティックMD-IFD
⑤ テイクホームメッセージ
🤖 AF2 は PPI ドッキングで PDB 代替可能
実験構造不在の PPI ターゲットでも AF2 モデルを安心して利用できる。
🎯 局所ドッキングが圧倒的に有利
TankBind_local + Glide がベスト。インターフェース中心グリッド定義が鍵。
🌊 アンサンブルは「運次第」
MD/AlphaFlow は改善できるが変動大。コンフォメーション選択戦略の確立が今後の課題。
📊 スコアリング関数が根本的限界
構造品質以上に現行スコアリング関数の不備がドッキング精度の天井を決めている。
ケムインフォmaticへの応用
適用先ユースケース
lib/dockingPPI インターフェース中心グリッド自動定義機能追加
lib/dockingドラッガビリティ別ツール自動選択ロジック実装
lib/mdMD アンサンブルドッキングの k-medoids 代表構造選択

AlphaFlow (MIT) との統合で実験構造なし PPI 系への VS パイプライン構築が可能

限界点
全体的 AUROC がモデスト(スコアリング関数の根本限界)
16 系のサンプルサイズで統計的検出力に制限
最良コンフォメーションの事前選択法が未解決
Induced Fit の限定フレキシビリティが IFD を過少評価か