cPaCS-MD: Accurate In Silico Prediction of Peptide Binding Free Energy
J. Chem. Inf. Model. 2026, 66, 413 — Prypoten, Norton, Chalmers (Monash Univ.) — DOI 10.1021/acs.jcim.5c02118
🎯 Contact-distance metric + MSMで
ペプチド-タンパク結合自由エネルギーを R²=0.84で予測
① 背景と課題

ペプチド薬(FDA承認薬の約8%)の計算的最適化には正確な結合自由エネルギー(BFE)予測が必要だが、ペプチドは小分子より格段に難しい。多くの回転可能結合、長い時間スケールのコンフォメーション変化、高い溶媒化エネルギーが原因で、既存手法(US、FEP)は定量的精度に届かない。

Umbrella Sampling: R²≈0.5(定性的精度に留まる)
FEP/アルケミカル: 高溶媒化エネルギーで定量困難
多様なペプチド系での系統的ベンチマークがなかった

→ cPaCS-MD + MSM: 多様な12複合体でR²=0.84, MAE=2.7 kJ/molを達成

② cPaCS-MD ワークフロー
平衡化構造

9本 × 100 ps 並列MD

contact-distance metric 計算

上位3本を選択(次サイクル初期構造)

[繰り返し → ペプチド解離まで]

tICA → k-means(50) → BayesianMSM(5) → ΔG°
③ Contact-Distance Metric
M_C = Σ (d_cur − d_init) for all contact pairs
  • 各ペプチド残基の N, C, Cα と
    最近傍タンパク質原子のペアを事前定義
  • COM距離より物理的に細かく解離を追跡
  • MDTrajで高速計算
USのプル座標問題を根本的に解消
④ MSMによるΔG°算出
  • 特徴量: タンパク側XYZ + ペプチドバックボーン二面角(cos変換)
  • tICA次元削減: implied timescale解析でlag time決定
  • k-means: 50クラスター中心
  • BayesianMSM: 5状態
ΔG° = W_unbound − W_bound + kT·ln(V_u/V°)
bound: RMSD < 0.15nm / unbound: COM 4〜6nm
⑤ 予測精度(12複合体ベンチマーク)
0.84
2.7
MAE (kJ/mol)
3.4
RMSE (kJ/mol)
手法定量精度
cPaCS-MD0.84✓ 高精度
Umbrella Sampling≈0.5✗ 定性的
FEP(ペプチド一般)低い✗ 困難
⑥ MD設定
  • CHARMM-GUI + Amber ff14sb + TIP3P + 0.15 M NaCl
  • 12.0 nm 立方体ボックス
  • GROMACS 2021.4
  • 9本 × 100 ps 並列MD / サイクル
  • C-rescale barostat + V-rescale thermostat
特定力場・ソフトウェア依存 — 他環境への移植要検証
⑦ lib/md 統合方針
  • CPaCSMDRunner クラス
    GROMACS並列実行 + メトリクス計算ループ
  • MSMパイプライン統合
    tICA → k-means → BayesianMSM → ΔG°
  • HBondAnalyzerとの組み合わせ
    各サイクルでの水素結合解析で結合モードを追跡
ペプチドドッキングポーズ → cPaCS-MD → ΔG° → 活性ランキング
⑧ Impact / 公開情報
  • ペプチドBFE予測の最初の多様系ベンチマーク
  • USを大幅に上回る定量精度(R²=0.84 vs 0.5)
  • 非バイアスMD使用 — 標準GROMACSで実行可能
  • コード: SI Python スクリプト
  • ライブラリ: MDTraj + PyEMMA + GROMACS
  • 複合体数: 12系(μM〜nM)