Generative Virtual Screening: From Search to Generate and Back

Authors: Thomas, Astudillo, Raouf, Navarro, De Fabritiis, Bender Affil: Khalifa Univ. / MBZUAI / Acellera / Cambridge DOI: 10.26434/chemrxiv.10001862 machine_learning
GOAL
ブルートフォースVSとde novo生成の中間に位置する Generative Virtual Screening (GVS) を、計算スケーリング・progressability・evaluabilityの3軸で位置付け直す。

1 背景と課題

創薬における化学空間探索は 探索性合成可能性計算コスト のトリレンマに直面している。

  • Brute force VS 全件ドッキング — 計算量がライブラリ規模に比例(O(N))し、数十億件規模では実行困難
  • De novo 自由生成 — 計算は軽いが 合成困難な構造を提案しがち(progressability低)
  • 2つのパラダイムは長らく 二項対立として論じられてきた

課題: 合成可能性を担保しつつ、make-on-demand化学空間(≈10⁹–10¹⁰)を効率的に踏破する戦略の体系化が必要。

2 手法の概要

本論文は レビューとして、化学空間探索手法をスペクトラム上に配置する 3軸評価フレームワークを提案する。

  • 計算スケーリング — ライブラリ規模Nに対する計算コストの増え方(O(N) / sub-linear / O(1))
  • Progressability — 提案分子が合成・購入・実験まで進める可能性
  • Evaluability — in silicoスコア(ドッキング・ADMET)の信頼性

この枠組みの中央に位置する GVS が、make-on-demand候補プール(Enamine REAL等)を制約とする 生成的最適化として定義される。

3 本研究で示したこと

  • パラダイム整理: BF VS / Surrogate VS (Deep Docking, ChemSTEP) / GVS / De novo (REINVENT) を同一軸で比較
  • GVSの定義: 既存ライブラリ内を BayesOpt・RL で選択的に探索するアプローチ
  • トレードオフ: スケーリング効率と実験移行率の両立を、GVSが 中央バランス点として実現
  • 実装ロードマップ: REAL-scaleでの BayesOpt over REAL を代表例として提示(Acellera Labs)

4-A 計算スケーリング比較

10³ 10⁵ 10⁷ 10⁹ 10¹⁰ ライブラリ規模 N 1 10² 10⁴ 10⁶ 10⁸ 計算コスト (CPU·h) BF VS O(N) Surrogate GVS De novo O(1)
N=10¹⁰級のmake-on-demandライブラリでは、BFはCPU·h ~10⁸スケール。GVSは ~10²–10³オーダーに圧縮し、De novoとBFの中間に位置。

4-B 3軸トレードオフ評価

Scaling Progressability Evaluability BF VS GVS De novo 外側ほど良
GVSはScaling中位(~10⁵程度の評価で10⁹空間カバー)かつ、Progressability・Evaluabilityの両方を高水準で維持。3軸全体で最もバランスの取れた領域に位置する。

4-C GVSの探索ファネル

Enamine REAL pool ~3 × 10¹⁰ make-on-demand 化合物 BayesOpt / RL surrogate 10⁵ – 10⁶ docking 評価のみ Top scored ≈ 10³ – 10⁴ 高スコア+多様性フィルター Order & assay ~10² 化合物 (4–6週で入手) 8桁の絞り込み
REAL ~3×10¹⁰ 候補を、BayesOptが ~10⁵–10⁶ ドッキング評価で踏破。最終的に ~10² 化合物が make-on-demand で実験へ進む。

4-D 既存手法の3軸スコア

手法 Scaling Progress. Eval. Brute Force VS Surrogate (DeepDock) GVS (BayesOpt/REAL) De novo (REINVENT4) 3軸スコア(■3つで満点)— GVSは全軸2.5以上を維持 Progress. = 合成可能性, Eval. = ドッキング/ADMET信頼度 Adapted from Thomas et al. ChemRxiv 2026
GVSは3軸全てで2/3以上のスコアを保ち、唯一の 全軸均衡型。BFは合成性・評価性は満点だがスケーリング不可。De novoはその逆。