Ultra-Large Virtual Screening Identifies PARP-1 and FSP1 Inhibitors via Adaptive Targeting
Gorgulla, Arthanari et al. (Harvard/MGH) | bioRxiv 2023 | DOI: 10.1101/2023.04.25.537981
🎯 18 次元プロパティグリッドによる事前フィルタで 690 億化合物の ULVS を 1000× 効率化、AWS 560万 CPU 準線形スケールで PARP-1/FSP1 の nM 阻害剤を発見。
① 背景と課題

EnamineREAL Space は 690 億化合物に到達。VirtualFlow 等の並列ドッキングはあるが、全件評価は計算量的に困難で、ランダムフィルタは真のヒットを逃すリスクがある。

既存 ULVS は数千万〜数億止まり、69B にスケールせず
プロパティ空間でのインテリジェントなプリフィルタ手法が未整備

→ ターゲットプロファイルから「優先ゾーン」を推定し、その領域のみドッキングする adaptive targeting。

② 手法の概要: ATG-VS
  • 18 次元プロパティ (MW, logP, HBD, HBA, TPSA, RotB, Ar/Aliphatic 環, charge…)
  • 離散化グリッドに 69B 化合物をマッピング
  • 既知リガンド/結合部位から優先ゾーン推定
  • 1500 種以上のドッキング設定でコンセンサス
  • クラウド分散実行 (AWS Batch)
② 手法の概要: 大規模インフラ
  • VirtualFlow プラットフォーム上で実行
  • AWS 最大 560万 CPU の準線形スケーリング
  • ビン分割で自然な並列化
  • 1500 ポーズ/スコア組合せの統合ランキング

事前計算 DB により対象を 1000 倍削減。

③ 本研究で示したこと
  • 69B 規模 ULVS が AWS で実行可能と実証
  • 計算対象を 1/1000 に削減して真のヒットを逃さず
  • PARP-1 で複数の nM 阻害剤、FSP1 でも nM 新規骨格
  • 共結晶構造でドッキング予測ポーズを直接検証
④ 主な結果 (a) 削減比率
対象化合物数 (log scale) 69B 全列挙 ~70M ATG-VS 後 1/1000
④ 主な結果 (b) スケーリング
throughput vs CPU count 10⁴ 10⁵ 5.6×10⁶ 理想線形 準線形 CPU 数
④ 主な結果 (c) 18次元プロパティ
カテゴリ項目
サイズMW, HA
極性logP, TPSA, HBD, HBA
柔軟性RotB
形状芳香環, 脂肪族環
電荷net charge
その他立体パラメータ等
④ 主な結果 (d) 取得ヒット
PARP-1 複数 nM 阻害剤、共結晶検証済
FSP1 新規骨格 nM 阻害剤(フェロプトーシス)
X-ray 予測ポーズと実測の良い一致
⑤ テイクホームメッセージ
事前フィルタが鍵
18次元グリッドで対象を 1000× 削減しても性能維持。
AWS 5.6M CPU で準線形
クラウドが ULVS のインフラとして機能。
1500 設定コンセンサス
単一スコアの偏りを統合で緩和。
共結晶検証で確証
計算上の "ヒット" でなく実構造的に妥当。
lib/docking 応用

UniDockRunner にプロパティグリッド前処理ステージを追加。VirtualFlow 互換のジョブ分割。

  • 18次元 binning ヘルパ
  • 1500-pose アンサンブル統合
  • AWS Batch 連携
本研究のインパクト
  • 69B 級 ULVS の実行可能性を実証
  • adaptive targeting というプリフィルタ概念を確立
  • PARP-1/FSP1 の新規 nM 阻害剤を提供