Guidelines for the analysis of free energy calculations
Klimovich, Shirts, Mobley | J. Comput. Aided Mol. Des. 2015 | DOI: 10.1007/s10822-015-9840-9
🎯 アルケミカル自由エネルギー計算(FEP/TI)の解析を標準化し、信頼性ある推定とQCを実現するベストプラクティスとPythonツールを提示する。
① 背景と課題

MDベースのアルケミカル自由エネルギー計算(FEP/TI)は創薬の結合・溶媒和ΔG予測に有力だが、解析手順がグループ毎にバラバラでベストプラクティスが普及していない。pymbarは存在したが統合解析ツールが不在。

推定器(DEXP/IEXP/BAR/MBAR/TI)の選び方が研究者依存で誤差評価が一貫しない
脱相関・収束・λ間オーバーラップの可視化を欠いた解析が横行

→ 推定器選択・脱相関・オーバーラップ・収束の4軸を網羅した標準パイプラインとツールを定式化。

② 手法の概要: MBAR推奨ワークフロー
  • pymbar.timeseries で統計的非効率性 g=1+2τ を計算し脱相関
  • u_kln[k,l,n] からMBAR自己無撞着方程式を解いてΔGを推定
  • K×Kオーバーラップ行列 O_ij をMBARから直接算出
  • 前向き/後ろ向き累積ΔG(t)で収束判定(1〜2 kT以内)
② 手法の概要: alchemical-analysis.py

GROMACS・SIRE・AMBER 出力を直接読み込む統合解析CLI。

9 推定器(TI/MBAR/BAR/DEXP/IEXP/GDEL/GINS/UBAR/RBAR)を一括計算
3 パッケージ(GROMACS/SIRE/AMBER)に標準対応

O_ij ヒートマップ・dF/dλ・累積ΔG(t)プロットを自動生成。

③ 本研究で示したこと
  • MBARを最小分散不偏推定として理論的に推奨
  • g間隔の脱相関を怠ると不確かさを過小評価する事実を明示
  • O_{i,i±1} < 0.03 という具体的なλ間隔不足の閾値を提示
  • RBFE等の標準プロトコル策定の基礎を作った
④ 主な結果 (a) 推定器間の一致
3-methylindole ΔG_hyd (kcal/mol) −5.5 TI BAR UBAR MBAR DEXP IEXP GDEL GINS 十分なサンプリングで全推定器が ≈ −5.5 kcal/mol で一致
④ 主な結果 (b) オーバーラップ行列
K×K Overlap Matrix O_ij (K=11) 赤セル = O_{i,i±1} < 0.03 → 追加サンプリング推奨
④ 主な結果 (c) 推定器の使い分け
推定器特徴推奨
DEXP/IEXP一方向Zwanzig
BAR双方向、自己無撞着
TI∂U/∂λ数値積分検証用
MBARK状態統合・最小分散不偏★最適
④ 主な結果 (d) 4ステップQC
脱相関サブサンプリング (g間隔)
複数推定器でΔG計算(MBAR優先)
オーバーラップ行列の確認
前向き/後ろ向き収束解析
⑤ テイクホームメッセージ
MBARが第一選択
K状態を統合した最小分散不偏推定。検証にTIを併用。
脱相関は必須
g=1+2τで間引かないと誤差が過小評価される。
O_ij で λ設計を点検
近接λで O<0.03 ならλ追加か中間状態の挿入。
収束解析でサンプリング不足を検出
前向き/後ろ向きが1〜2 kTで一致しなければ要延長。
lib/fep への適用ポイント

DockFEP/MMGBSAEngine 共通の解析バックエンドに pymbar を採用し、本論文の4ステップQCをデフォルトのレポート項目化。

  • FEP出力 → u_kln 構築 → MBAR
  • O_ij ヒートマップを自動生成
  • 累積ΔG(t)プロットをHTMLレポートに同梱
本研究のインパクト
  • FEP解析の事実上の標準を提示し、後続のRBFEベストプラクティスの基礎に
  • alchemical-analysis.py が GROMACS/SIRE/AMBER 横断のリファレンス実装に
  • O_ij と収束プロットがレビュアー必須チェック項目として定着