1背景と課題
仮想スクリーニングはLBVS(速いが受容体非依存)とSBVS / ドッキング(精度高いが計算重い)の二極化が長く課題。
数百万化合物規模のenumerated libraryを扱う際、Glide SP級ドッキングは1ターゲットでも数日〜数週間。
LBVS(ROCS等)はミリ秒級だが、テンプレートと形が似ていても受容体ポケットに入らない化合物を区別できず、
誘導適合(induced fit)が効くキナーゼ・GPCRで失敗が頻発する。
2手法の概要:G-align + 受容体ボクセル
コアアルゴリズムG-alignはテンプレート活性リガンドに被験化合物をflexibleに重ね合わせる。
重ね合わせ過程で受容体ポケットのボクセルマップを制約として与え、衝突する配座をペナルティ化。
3本研究で示したこと
(i) 受容体形状制約付きフレキシブルアライメントというLBVSとSBVSの中間アプローチが実用可能。
(ii) DUD-E と LIT-PCBA で OpenEye ROCS 比 平均 AUC +0.08 の向上を、ドッキング比 1/20 の計算コストで達成。
(iii) 誘導適合が重要なキナーゼ・GPCRでドッキングとの性能差が縮小、フレキシブルテンプレ+クラッシュペナルティの組合せが効くことを示した。
(iv) ProLIF 連携の2段階ワークフローで定量的相互作用フィルタも実装。
4主な結果
(a) ベンチマーク AUC (DUD-E + LIT-PCBA 平均)
G-screen は ROCS から +0.08、Glide SP に近接。中間アプローチの有効性。
(b) 計算コスト vs スクリーニング性能
Glide SP の精度に近接しつつ計算コストは約 1/20。Pareto の良い側に位置。
(c) スループット:1M化合物の流れ
100万化合物→アライメント→上位プール→ProLIF相互作用フィルタの2段ファネル。
(d) ターゲットクラス別 AUC ギャップ
誘導適合が重要なキナーゼ・GPCRで改善幅が大きく、設計仮説と整合。
5テイクホームメッセージ
- 受容体形状制約付きフレキシブルアライメントは LBVS と SBVS の中間点として実用域に到達した。Glide SP の AUC に約 0.02 差まで迫り、コストは 1/20。
- 誘導適合の効くキナーゼ・GPCR で +0.10〜+0.12 AUC の押し上げを得られ、形状+ポケットクラッシュペナルティという単純な拡張が大きく効くことが示された。
- GPU 並列実装で 1 GPU・数時間で 100 万化合物。enumerated library 規模のスクリーニングを現場のワークフローに乗せられるスループット。
- ライブラリ統合の余地:
lib/docking に G-align 風スコアラー(shape + ESP + voxel clash)と ProLIFCalculator 連携の 2 段フィルタを実装すべき。テンプレ依存の弱点は lib/molgen 側からのテンプレ自動生成で補う設計が有効。