Hit Identification in Ultra Large Virtual Screening: An Integrative Review and Future Challenges
Fang, Sim et al. (Swinburne Univ./NUS) | Drug Discovery Today, 2026年1月 | DOI: 10.1016/j.drudis.2026.104616
🎯 数十億〜兆件規模のmake-on-demandライブラリへの超大規模VS(ULVS)戦略を整理。階層的スクリーニング・MLサロゲート・アクティブラーニング・GVSの4パラダイムを体系化する。
① 背景と課題

Enamine REAL(36B件)・GalaXi(>100B件)等のtrillion-scale make-on-demandライブラリが登場。従来のDOCK/Glide全件ドッキングはこのスケールに適用不可能であり、新世代ULVSパラダイムが必要。

古典的全件ドッキング: 36B件 × ~1秒/分子 = ~1000年以上の計算時間(単一GPU)
アクティブラーニングのバイアス: 既知活性空間に集中し新規スキャフォールド発見の障壁
ヒット率の検証: ドッキングスコアと実験活性の相関が依然として課題

→ 4段階階層スクリーニング + MLサロゲート + ALループで億件スケールへの現実的対応が可能

② 手法: 4段階階層スクリーニング
ULVS 4段階フィルタ ① LBVS(Tanimoto/形状): 全ライブラリ → 1/10〜1/100 ② MLサロゲート(Deep Docking/ORCA): → 1/100〜1/1000 ③ 精密ドッキング(UniDock/Glide): → 1/10 ④ FEP/MM-GBSA: 最終選定
② 手法: アクティブラーニング & GVS

アクティブラーニングループ: 各ラウンドのヒット情報でMLモデルを再訓練→探索効率を反復改善。

生成的VS(GVS): Thomas/Bender(2026)——既存ライブラリを生成的最適化で探索するハイブリッドアプローチ。

36B件
Enamine REAL ライブラリ(make-on-demand)
>100B件
GalaXiライブラリ(trillion-scale)
③ 本研究で示したこと(要点)
  • 4段階階層スクリーニング + MLサロゲートで億件スケールを現実的計算時間で処理
  • ライブラリが大きいほどヒット率が向上(ChemSTEP: 12%→60%)という逆直感的な発見
  • アクティブラーニングによる反復的サンプリング効率改善がULVSの実用的な実装
  • GVSという「生成型VS」という新パラダイムを体系化
④ 主な結果 (a) ライブラリ拡大とヒット率
ライブラリ規模 vs ヒット率(ChemSTEP/AmpC) 12% 41% 60% ↑ ~1M件 ~100M件 ~36B件 ヒット率
④ 主な結果 (b) ULVS 4パラダイム比較
パラダイム速度精度新規性
階層的スクリーニング★★★★★★★★★
MLサロゲート★★★★★★★★★★★
アクティブラーニング★★★★★★★★★★
GVS(生成的VS)★★★★★★★★★★★★
④ 主な結果 (c) 主要実装例
Deep Docking
ドッキングスコア近似MLサロゲート(GitHub公開)
ChemSTEP
階層的スクリーニング(AmpCでヒット率60%実証)
ORCA
MLサロゲート型大規模スクリーニング
④ 主な結果 (d) lib/docking への統合指針
UniDockRunner
4段階階層化の③精密ドッキング層として Enamine REAL に適用可能
MMGBSAEngine
④最終評価層として階層スクリーニングの末端に統合
lib/molgen ALループ
スクリーニングヒットを次の生成設計にフィードバックする閉ループ
⑤ テイクホームメッセージ
ライブラリが大きいほどヒット率が上がる逆直感
ChemSTEP: 1M→36B件でヒット率12%→60%。大規模化は精度向上のチャンス
4段階階層化をlib/dockingに実装
LBVS→MLサロゲート→UniDockRunner→MMGBSAEngineの段階的フィルタで Enamine REAL 対応が現実的
アクティブラーニングで反復改善
スクリーニングヒットでMLモデルを再訓練するALループをlib/molgenのフィードバック機構として実装する
GVSが次世代ULVSパラダイム
既存ライブラリを生成的最適化で探索するGVSはlib/molgenとlib/dockingの統合の最良のユースケース
ライブラリ規模別 推奨手法
規模推奨アプローチツール
~1M件精密ドッキングUniDockRunner
~100M件MLサロゲート→精密ドッキングDeep Docking + UniDock
~36B件4段階階層 + AL全パイプライン統合
1T件超GVS(生成的探索)lib/molgen連携
本研究のインパクト
  • lib/dockingにLBVS→MLサロゲート→UniDock→MMGBSAの4段階パイプラインを実装することでEnamine REAL対応が実現
  • アクティブラーニングループをlib/molgenのフィードバック機構として統合し閉ループVS設計が可能に
  • GVSパラダイムはlib/molgenとlib/dockingを統合した次期主要機能として優先的に設計すべき