FlashAffinity: Bridging the Accuracy-Speed Gap in Protein-Ligand Binding Affinity Prediction
Jiang, Chen, Cao, Jin (Northeastern University) · DOI: 10.64898/2025.12.22.695983 · Dec 2025
⚡ Boltz-2を50倍高速化:EGNN + FABind+で大規模バーチャルスクリーニングの精度-速度問題を解決
① 背景と課題

Boltz-2は高精度だが35秒/pairの計算コストが数百万化合物スクリーニングの壁。配列ベース(BACPI)・リガンドのみ(GAT)は高速だが精度不足。

50x
FlashAffinity vs Boltz-2 の推論速度比
2.5ms
事前処理済み複合体のスコアリング速度
② FlashAffinityアーキテクチャ
タンパク質配列Sp + リガンドSMILES Sl
↓ FABind+ (高速ドッキング) ← Boltz-2の構造予測を置き換え
↓ 適応クロッピング Fcrop(ポケット抽出)
↓ 多関係グラフG構築(内部/外部/グローバルエッジ)
↓ EGNN L=5等変レイヤー(回転/並進不変)← PairFormerを置き換え
↓ スナップショットアンサンブル
親和性回帰 yaffinity or バインダー分類 pbind

グループベースミニバッチ(アッセイID別)+ Focal Loss/Huber Lossで学習ノイズ対処

③ グラフ設計の工夫
  • 内部エッジ: 共有結合トポロジー(1.8Å以下)
  • 外部エッジ: タンパク質-リガンド非共有結合(5.0Å以内)
  • グローバルノード: 全体構造コンテキスト
  • ノード特徴: 事前学習タンパク質埋め込み + 化学特性

MEAN (Kong et al. 2023) のエッジスキーマに基づく3スケール設計

④ ベンチマーク結果
データセットBoltz-2 RFlashAffinity RBACPI RGAT R
OpenFE0.620.440.290.28
FEP+ 4 targets0.660.530.140.40
CASP160.650.650.410.50

バインダー分類 EF@1%: FlashAffinity 14.13 vs Boltz-2 13.95(FlashAffinity僅かに優位)

OpenFE・FEP+ではBoltz-2に対してR差 0.13〜0.18。精密回帰は改善余地あり
⑤ 速度比較
0.7s / pair
フルパイプライン (FABind+ + EGNN) — L40S GPU
2.5ms / pair
EGNNスコアリングのみ(事前処理済み複合体)
35s / pair
Boltz-2(比較)

100万化合物スクリーニング ≈ 42分(スコアリングのみ)

⑥ ケムインフォパイプラインへの応用
lib/docking (高優先度)

UniDockRunner後段にEGNNリスコアリングを統合。Chemgauss4置き換えまたは補完。2.5ms/pairで100万化合物処理可能。

lib/fep (高優先度)

多段階スクリーニング: UniDock→FlashAffinity→MMGBSA→FEPの階層的コスト配分。FEP候補を1/100に絞り込み。

  • グループベースミニバッチ戦略はlib全体のMLモデル学習に汎用応用可能
  • FABind+: https://github.com/QizhiPei/FABind
⑦ X投稿用要約

Boltz-2を50倍高速化!FlashAffinityがバーチャルスクリーニングの壁を破る⚡ EGNNスコアリングで2.5ms/pair、EF@1%でBoltz-2超え。100万化合物スクリーニングが現実に #DrugDiscovery #AI創薬