AI生成リガンド検証パイプライン: コンセンサスドッキング → 分子動力学
Abbasi, Váz, Silva, Martins — IWBBIO 2025, LNBI 16050, pp.34–44, 2026 · DOI: 10.1007/978-3-032-08455-2_3
🎯 LSTM+RL生成分子を6ドッキングツールベンチマーク→ECRコンセンサス→50ns MDの3段階で系統的に検証
① パイプライン全体像(3段階)
Step I
6ツール
クロスドッキング
ベンチマーク
Step II
LSTM+RL生成
ライブラリへ
ECRスクリーニング
Step III
50 ns MD
結合安定性
検証
In silico
lead化合物
選出

標的: アデノシンA2A受容体(A2aR) + ユビキチン特異的プロテアーゼUSP7。ECR(指数コンセンサスランキング)でソフトウェア固有バイアスを低減。

ECR(c) = Σᵢ exp(-rankᵢ(c) / σ) # 複数ツールで一貫して高ランク → 指数的に高スコア
② 6ドッキングツール比較結果
ツールRMSD(Å)2Å以内%Pearson r速度
AutoDock FR1.290%0.7227.5秒
AutoDock Vina1.385%0.58-0.59中速
AutoDock 41.865%中速
LeDock2.450%0.21-0.35中速
PLANTS2.730%0.21-0.35中速
rDock3.925%-0.13〜低8.9秒(最速)
rDockはUSP7でPearson r=-0.13(予測不能)。最速でも精度が最低
③ MDシミュレーション設定
項目設定値
ソフトウェアGROMACS v2021.4
力場GROMOS96 53a6
水モデルSPC
NVT平衡化300K / Berendsen / 5 ns
NPT平衡化1 bar / Parrinello-Rahman / 5 ns
本番MD50 ns / 2 fs timestep

解析: RMSD・RMSF・水素結合・2Dインタラクション。リガンドRMSD < 2.5 Åで安定性確認。

④ ECR vs 単一ツール 性能比較
AUC向上
ECRコンセンサスが単一ツール・QEDスコアを上回るROC-AUCを達成
< 2.5 Å
ECR上位化合物の50 ns MD中リガンドRMSD(主要候補)

コンセンサス選出化合物がMD安定率で優位。単一ツール依存のリスクを数値で実証。

⑤ Morgan+RFバイアス解析

脂溶性/分子サイズ依存のドッキングスコア歪みをRandom Forestで検出:

  • 大型疎水性フラグメント → 過高評価(A2aRのIle66/Met177/Leu267疎水ポケット起因)
  • 小型極性フラグメント → 過低評価傾向
  • Morgan FP (r=2, 2048 bits) + RF でバイアス分類
コンセンサスドッキング + MLバイアス補正を組み合わせることが推奨
⑥ 限界点
  • 化合物数・ECR σ値等の詳細パラメータ未記載(会議論文の文字数制約)
  • FEP/精密ΔG評価は未対応
  • A2aR GPCRでの水分子依存性問題が残存
  • 2標的のみの検証(汎用性要評価)
⑦ テイクホームメッセージ
🤝 ECRがコンセンサスの鍵
指数変換による多ツールランク統合でAI生成分子のAUCが向上。単一スコアへの依存を脱却。
🏆 ADFR + Vinaが最優秀
RMSD 1.2/1.3Å、Pearson r=0.72/0.58。rDockは最速だが予測精度が最低。
🔬 50 ns MDで安定性担保
ECR上位化合物でリガンドRMSD<2.5Åを確認。dockingからMDへのフィルタリングが有効。
⚠️ バイアス補正が必須
脂溶性依存の過高評価をMorgan+RFで可視化。スコアリング関数の盲点を機械学習で検出。
ケムインフォマティクスへの応用
適用先実装優先度ユースケース
lib/dockingHighUniDockRunner出力のECR統合スコアラー実装
lib/dockingMediumMorgan+RFドッキングバイアス検出器の追加
lib/mdHighHBondAnalyzerにリガンドRMSD/RMSFパイプライン追加
lib/molgenMediumMolgenYamlにECRスコア+MDスタビリティフィルタ統合