SculptDrug: A Spatial Condition-Aware Bayesian Flow Model for Structure-based Drug Design
BFN + Boundary Awareness Block + k-means++階層エンコーダで CrossDocked2020 全SOTA超え(arXiv:2511.12489, Zhong & Hu et al., 2025)
🎯 3課題(境界制約・階層条件・空間忠実度)を同時解決。MPBG% +7.95%(参照より良いリガンド生成、唯一正値)達成
① 既存SBDDモデルの3つの課題
課題1: 境界制約の欠如
ポケット外にリガンドが生成される可能性 → 立体衝突が頻発
課題2: 階層条件の統合困難
グローバル構造(足場形成)とローカル相互作用(精密結合)を同時に捉えられない
課題3: 空間モデリング忠実度
既存拡散モデルはΔtの離散化誤差やノイズスケジュール設計の困難さがある

→ SculptDrug: BFN + BAB + Hierarchical Encoderで3課題を一括解決

② BFNフレームワーク
【損失関数】
L(x) = L_n(x) + L_r(x)

L_n = Σ E[KL(p_S^i || p_R^i)]
L_r = -E[log p_O(x|θ;1)]

送信分布 p_S → Bayesian更新 → 受信分布 p_R
prior → posterior へ段階的に洗練

拡散モデルと異なりBayesian更新で分布を直接精製

③ 2つの新機構

Boundary Awareness Block (BAB)

  • 表面アトム → 仮想原子生成 → 等変アテンション
  • リガンド座標更新に表面制約を伝播
  • ポケット外生成を物理的に抑制

Hierarchical Encoder

  • k-means++でグローバル仮想原子生成
  • Vina由来エッジ(2.7/3.4/5.0Å)でローカル精製
④ CrossDocked2020 ベンチマーク
MethodVina Score↓IMP%↑MPBG%↑QED↑
Pocket2Mol-5.2331.06-15.030.65
DecompDiff-6.5954.86-1.590.66
MolCRAFT-6.0834.84-67.370.50
DiffBP-5.238.600.59
SculptDrug-6.9456.50+7.950.54

MPBG%で唯一ポジティブ → 参照リガンドより平均的に高い親和性を持つリガンドを生成

⑤ 階層エンコーダの設計
タンパク質原子
↓ k-means++ (k個の仮想原子を生成)
↓ 距離aware集約 → 仮想原子特徴量
↓ グローバル等変アテンション (adaptive edge τ)
↓ ローカル精製 (2.7/3.4/5.0Å マルチエッジ)
↓ 最終タンパク質コンテキスト表現

Vina距離閾値: 立体反発(2.7Å) / 短距離(3.4Å) / vdW(5.0Å)

⑥ 多面的評価指標での優位性
-8.06 kcal/mol
Vina Dock(再ドッキング後)IMP% 60.78%
  • QED 0.54 / SA 0.67(全ベースライン最高)
  • 結合長JSD・歪みエネルギー・立体衝突でも最良
  • Vina Score・Min・Dock全3指標で最高 or 競争力
⑦ 限界と課題
  • タンパク質柔軟性(誘導適合)は考慮外
  • BFNの訓練・推論速度の詳細比較なし
  • 大規模仮想スクリーニングへのスケーラビリティ未検証
実験的検証(binding assay)は未実施
⑧ テイクホームメッセージ
🔬 BFNがSBDD生成フレームワークとして有効
Bayesian更新による逐次洗練は拡散モデルより空間的制約を取り込みやすく、Vina Score・QED・SA全指標でSOTA達成。
🛡️ BABで参照より良いリガンドを生成(MPBG+7.95%)
表面制約を明示的に組み込んだ設計により、参照リガンドの質を超える候補を安定生成。全ベースライン中唯一。
📐 Vina由来エッジが精密相互作用に有効
実験的距離閾値(2.7/3.4/5.0Å)に基づくエッジ設計が効果的。AutoDock Vinaとの整合性が高く、ドッキング評価との相性も良い。
🔗 コード公開(GitHub)
github.com/decisionintelligence/SculptDrug で実装公開。lib/molgenへのBFN統合の参照実装として即活用可能。
ケムインフォマティクスへの応用
適用先ユースケース
lib/molgenBFN+BABをJobManagerに統合し立体妥当なリガンド生成
lib/dockingVina距離閾値(2.7/3.4/5.0Å)をProLIFCalculatorのエッジ分類に採用
lib/mdk-means++仮想原子によるポケットコースグレイン表現をMD解析に活用
本研究のインパクト
  • BFNがSBDDにおいて拡散モデルより有効であることを示す先駆的研究
  • 参照リガンドを超える分子を安定生成できる初のSBDDモデル(MPBG%+)
  • Vina距離閾値のGNNエッジ設計への組み込みという実用的知見を提供