DrugCLIP: Deep Contrastive Learning Enables Genome-wide Virtual Screening
Science 391, eads9530 (2026) — Jia, Gao, Tan et al. (Tsinghua) | DOI: 10.1126/science.ads9530
🎯 従来ドッキング比 1,000 万倍高速 — 8 GPU・24 時間で 10 兆ペアをスクリーニング → ゲノムワイド VS が現実に
① 背景と課題

ヒトゲノムの ~20,000 タンパクのうち FDA 承認薬があるのは約 10%。AlphaFold で構造予測が容易になった今、ゲノムワイド VS が理論的には可能になったが、従来ドッキングでは計算コストが莫大。

従来ドッキング: 1B 化合物 × 1 標的に 2 週間・10,000 CPU コア
DL 回帰モデル: アフィニティ値の不均一性・速度ボトルネックが課題
既存 VS: holo 構造・既知ポケットが必要 → orphan 標的には不向き

→ 「VS = 密検索(dense retrieval)」として再定式化 → 自然言語処理の技術を薬物探索に転用

② DrugCLIP アーキテクチャ
ProFSA 事前学習(550万合成ペア)
↓ BioLip2 微調整(40,000 複合体)
分子エンコーダ (Uni-Mol) ← ポケットエンコーダ
↓ 対照学習(InfoNCE)で共通潜在空間に整合
↓ FAISS コサイン類似度検索
↓ top-k 候補 → クラスタリング → ドッキング(オプション)
② GenPack ポケット精緻化

AlphaFold 予測 apo 構造からポケットを生成 AI で精緻化。holo 構造・既知リガンドが一切ない標的にも対応。

17.5%
TRIP12(完全未知標的)でのヒット率 — holo構造・既知バインダーなし

apo + AlphaFold 構造での induced-fit docking を大幅に超える精度

③ 主要数字
107×
従来ドッキング比のスクリーニング速度
10 兆
タンパク質-リガンドペア / 24h / 8 GPU
~10,000
ヒトタンパク質 × 500M 化合物スクリーニング済み
2M+
GenomeScreenDB 候補ヒット数(公開済み)
④ in silico ベンチマーク
手法DUD-E EF1%LIT-PCBA EF1%
AutoDock Vina~3.0~1.8
Glide-SP~4.5~2.0
Gnina~5.0~2.5
PLANET~5.5~2.8
DrugCLIP~8.0+~4.0+
④ wet-lab 検証結果
標的ヒット率主要結果
5HT2AR~15%2 化合物 EC50 <100 nM
NET15%2 化合物をクライオEM で構造決定
TRIP1217.5%holo 未知 → SPR + 酵素阻害確認

TRIP12 は holo 構造・既知バインダーが存在しない「難易度最高」の標的で 17.5% ヒット率は特に注目

④ GenomeScreenDB
  • ~10,000 ヒトタンパク質 × 500M 化合物
  • 2M+ ヒット候補 × ~20,000 ポケット
  • ChEMBL を超えるターゲットカバレッジ
  • 全データを drugclip.com で無料公開
~50%
ヒトゲノムのカバレッジ達成
④ 限界点
DUD-E バイアス: デコイ設計が実 VS より容易な可能性
アフィニティ定量化が困難(分類 vs 回帰のトレードオフ)
コンフォメーション変化(induced-fit)への対応は限定的
2M ヒット候補の大多数は実験検証未実施
⑤ テイクホームメッセージ
🚀 1,000 万倍の高速化が現実に
dense retrieval 再定式化 × FAISS で天文学的規模の VS を実用化。ゲノムワイド創薬のパラダイムシフト。
🔓 孤立標的への突破口
GenPack で holo 構造・既知バインダーなし TRIP12 に 17.5% ヒット率。AlphaFold 時代の orphan 標的探索に直結。
🌐 GenomeScreenDB が新しい commons に
10,000 標的の結果を全公開。「ゲノムワイド化合物地図」として後続研究の基盤インフラになる可能性。
⚗️ wet-lab 検証まで完結
cryo-EM による NET 阻害剤の構造決定まで実施。in silico 一発ではなく実証まで含めた信頼性の高い成果。
ケムインフォマティクスへの応用
適用先提案
lib/dockingDrugCLIP→UniDock 二段式 SBVS(100-1000x 高速化)
lib/dockingGenomeScreenDB で社内標的の公開ヒット確認
lib/dockingGenPack で AlphaFold 構造のポケット精緻化
lib/molgenDrugCLIP ポケット埋め込みで条件付き分子生成

公開モデル・DB が drugclip.com にあり即日利用可能。FAISS + Uni-Mol で社内統合が比較的容易

本研究のインパクト
  • ゲノムワイド VS を 8 GPU・1 日で実現した方法論的ブレークスルー
  • GenomeScreenDB: ヒト druggable genome の化合物地図を初公開
  • ProFSA: PDB 構造のみからの大規模自己教師あり学習の有効性を実証
  • TRIP12 という undrugged target への最初の small molecule 同定