BindFlow: 絶対結合自由エネルギー計算のオープンソース統合パイプライン
FEP(二重デカップリング + TI/MBAR)と MM(PB/GB)SA を一元化 — bioRxiv 2025, Martínez León & Hub(Universität des Saarlandes)
🎯 ABFE 計算を完全自動化し、FEP とコスト効率的な MM(PB/GB)SA を同一フレームワークで比較。139 配位子/受容体ペアで FEP+ 相当の精度を OSS で達成
① 背景と課題

結合自由エネルギー(ΔG_bind)の精度予測は創薬の中核課題であり、RBFE は同族リード最適化に強い一方、ABFE は多様な分子セットのスクリーニングや結合ポーズ検証に不可欠。しかし既存 ABFE ツールは商用ライセンス(FEP+)または専門的セットアップ知識が必要で、再現性や可搬性に欠けていた。

既存 OSS ツール(BFEE2, A3FE, BAT2)は FEP のみで MM(PB/GB)SA と統合されていない
力場依存性の系統的評価・膜タンパク質対応・コファクター系が未整備なものが多い
大規模キャンペーン(60,000+ 計算)に耐えるスケジューリング基盤が欠如

→ GROMACS + Snakemake + TOFF を統合し、ABFE 全パイプラインをワンコマンドで起動可能な無償 OSS として提供

② 2手法の統合アーキテクチャ
FEP パイプライン(厳密法)
系構築 → 平衡化(NVT→NPT)
→ Boresch 拘束決定
→ λ窓プロダクション(クーロン→vdW)
→ TI / MBAR で ΔG 積算 + 拘束補正
MM(PB/GB)SA パイプライン(高速法)
系構築 → 複合体MD(~3 ns のみ)
→ gmx_MMPBSA で事後エネルギー分解
→ ΔG_bind(± エントロピー補正 IE/C2)

両パイプラインを calculate(calculation_type='fep'|'mmgbsa') の1行で切り替え可能。Snakemake DAG がタスク依存を管理し、SLURM / デスクトップ両環境に対応。

③ 対応力場と設定
GAFF-2.11
AMBER 系 GA 力場。amidinium 塩橋で過強評価の傾向あり。TYK2・CypD で最良 τ
OpenFF-2.0.0
SMIRNOFF 系。A2A では GAFF と同等の τ。一般的に安定した挙動
Espaloma-0.3.1
GNN 系機械学習力場。A2A(Na⁺ 系)・Thrombin(amidiniumリガンド)で悪化傾向
タンパク質 FF
Amber99sb-ildn(デフォルト)/ Amber14sb。膜は SLipids2020。水は TIP3P
TOFF
GAFF / OpenFF / Espaloma を統一 API で切り替え可能なパラメータ生成パッケージ
④ 検証結果: 139 配位子 × 8 受容体 × 3 力場
受容体N手法力場Kendall τocRMSE (kcal/mol)備考
Cyclophilin D10FEPEspaloma0.820.92最易クラス
A2A10FEPGAFF0.691.64膜GPCRタンパク
MCL125FEPGAFF0.611.47荷電配位子含む
TYK213FEPGAFF0.511.04
Thrombin22FEPGAFF0.002.00lig4 outlier (amidiniumリガンド)
PTP1B22FEPGAFF0.362.14MSE≈-10 kcal/mol induced-fit
全系統合138FEPGAFF0.561.59FEP+ と同等水準
1/180×
MM(PB/GB)SA のコスト vs FEP(~3 ns vs ~540 ns 相当)
1,215
FEP シミュレーション総数(triplicates)
7,254
MM(PB/GB)SA 計算総数(力場 × エントロピー設定 × triplicates)
⑤ MM(PB/GB)SA の有用性と限界

良好なランキング受容体:

  • A2A・CypD・SAMPL6-OA で Kendall τ ≈ 0.6〜0.8(FEP に匹敵)
  • PTP1B・TYK2・MCL1 でも許容範囲内のランキング
  • 計算コスト 1/180 で大規模プレスクリーニングに実用的
絶対値精度は不良: MSE が -25〜-75 kcal/mol に達し絶対 ΔG 予測には使えない
P38・Thrombin ではランキングも不良 → 受容体依存性が高い
エントロピー補正: C2 は一貫してランキングを悪化させる。IE 効果は軽微。補正なしが基本戦略

→ MM(GB)SA でプレスクリーニング → 上位化合物に FEP という二段階戦略が推奨される

⑥ lib/fep への実装計画

新規追加コンポーネント:

  • ABFERunner: FEP / MM(GB/PB)SA 切り替え統合クラス
  • BorechRestraintSetup: 自動拘束選択 + 解析的補正計算
  • LambdaWindowScheduler: Snakemake DAG 経由で λ 窓を SLURM 並列展開
  • ForceFieldFactory(ff): GAFF/OpenFF/Espaloma を TOFF 経由で統一
dg = ABFERunner(method='fep', force_field='gaff2', n_replicates=3)
.run(protein_pdb, ligand_mols, global_config)

既存 MMGBSAEngine を継承・拡張し、calculation_mode='abfe' オプションを追加する設計が現実的。

⑦ 既存ライブラリとのギャップ
  • ABFE(絶対結合自由エネルギー)のサポートが未実装 → 現在は MM-GBSA エンドポイントのみ
  • Boresch 拘束の自動設定・TI/MBAR 積算が未実装
  • Snakemake ベース SLURM スケジューラが未実装
  • GAFF/OpenFF/Espaloma の力場切り替え API が未整備
  • 膜タンパク質・コファクター含む複合系対応が未実装
  • gmx_MMPBSA エントロピー補正(IE/C2/nmode)が未実装
⑧ 限界点と今後の展望
Induced-fit 系(PTP1B): MSE≈-10 kcal/mol → enhanced sampling(H-REX)が必要
荷電配位子: PME 有限サイズ効果 → co-alchemical イオン補正が未実装
水交換 (slow mode): グランドカノニカル MC 法等が必要
Espaloma の Na⁺/amidinium 系での精度低下 → 力場改善余地

将来実装予定:

  • Hamiltonian レプリカ交換による収束加速
  • 適応的 λ 資源配分(難サンプリング窓に集中投資)
  • 電荷補正(co-alchemical ion approach)