AlphaFold2-RAVE: From Sequence to Boltzmann Ranking
J. Chem. Theory Comput. | 2023 | DOI: 10.1021/acs.jctc.3c00290
AF2のシングル構造の限界を超え、MSA短縮 + AI強化MD(RAVE)で配列から直接ボルツマン加重コンフォメーションアンサンブルを生成。
背景:AF2 の単一構造ではアンサンブルが扱えない

AlphaFold2 は配列から高精度な単一構造を予測するが、生体分子は熱力学的確率分布(ボルツマン分布)に従う動的アンサンブルとして機能する。アロステリ・相転移・コンフォメーション依存の薬剤結合を捉えるには、単一構造ではなく重み付きアンサンブルが必要となる。

MSA 深さ短縮(Wayment-Steele 2023 等)でコンフォメーション多様性は得られるが、ボルツマン重みが付かない ため熱力学的に解釈できない。
通常の unbiased MD は μs〜ms 時間スケール障壁を越えられず、サンプリング不足。

→ 配列のみから物理的に妥当な重み付きアンサンブルを得るプロトコルを構築する。

手法:AF2 + RAVE のハイブリッド
  • MSA subsampling で AF2 から多様な seed 構造を生成
  • 各 seed を出発点に短時間 unbiased MD を実施
  • VAE で低次元コレクティブ変数 (CV) を学習
  • RAVE 重要サンプリングで自由エネルギー面を探索
  • ボルツマン重みで再加重し物理的な集団を抽出
配列 → ボルツマン加重アンサンブル パイプライン Sequence AF2 + MSA subsamp. seed structs (diverse) short MD trajectories VAE → CV (low-dim) RAVE biased MD (importance) Boltzmann reweighting P(x) ∝ exp(−βF(x)) アンサンブル
本研究で示したこと
  • 配列のみから熱力学的アンサンブルを生成
  • AF2 単独より広いコンフォメーション空間を探索
  • NMR / 参照 MD アンサンブルと整合する重み分布
  • ミスセンス変異による構造シフトを再現
  • 不安定構造をボルツマン重みで自動的に減衰
MSA 多様性に頼った先行手法と異なり、確率重みが付くため自由エネルギー差・占有率の議論が可能
(a) MSA 深さとコンフォメーション多様性
MSA subsample 深さ vs 構造多様性 (模式) RMSD spread MSA depth (sequences, log scale) AF2 default (深MSA) subsample N≈64 subsample N≈8〜16 + RAVE 探索 浅 MSA × RAVE が最も広い CV 空間を被覆

浅い MSA で AF2 の多様性が増大し、さらに RAVE がエネルギー障壁越えを担う。

(b) ボルツマン重み付き自由エネルギー
CV1 軸の自由エネルギー F(CV) 概形 CV1 (VAE 学習) F (k_B T) AF2 + unbiased MD AF2-RAVE (重み付き) apo-like alt-state ~3 k_B T 障壁

unbiased MD は 1 basin に閉じ込められるが、RAVE は障壁を越えて 2 状態の F(CV) を再構築。

(c) 参照アンサンブル一致度
アンサンブル多様性ボルツマン重み参照一致
AF2 単発予測×
AF2 + 浅 MSA中〜高
unbiased MD有 (局所)
AF2-RAVE有 (大域)○ NMR / 参照MD
変異タンパクのコンフォメーション応答
変異前後で重み再分配を再現
(d) ケース:ミスセンス変異の重み再分配
WT vs 変異体 ボルツマン占有率 (CV1) 状態 (state) P (占有率) ~0.78 ~0.22 ~0.45 ~0.55 apo alt WT mutant 変異で alt 状態が安定化 → 重み逆転

ミスセンス変異により alt 状態のボルツマン占有率が逆転する挙動を予測(数値は論文の挙動を反映した模式)。

テイクホームメッセージ
配列 → 重み付き集団
AF2 の MSA subsampling と RAVE の AI-CV 学習を結ぶことで、配列単独から熱力学的に解釈可能なアンサンブルが得られる。
障壁越えは MD に任せる
AF2 は seed の多様性を提供し、ボルツマン分布の物理は RAVE/MD が担う、という役割分担が要点。
変異の機能インパクト予測
WT と変異体で同じパイプラインを回すと、占有率の再分配としてアロステリックなシグナルを抽出できる。
ミリ秒級は依然として課題
非常に遅い遷移や複合体アンサンブルへの拡張、CV 学習の収束保証は次のステップ。
応用:lib/md パイプラインへの取り込み
  • EnsembleGenerator: AF2 出力 + MSA depth スイープを seed 化
  • VAECollectiveVariable: トラジェクトリから CV を学習し RMSDAnalyzer と接続
  • BoltzmannReweighter: HBondAnalyzer の occupancy を重み付き再集計
  • FEP/MM-GBSA で「重み付き複数シード」入力に拡張可能
インパクト
  • 配列のみからクリプティックポケット候補を熱力学的に列挙する道が開く
  • 変異影響評価(疾患関連 SNV)を構造アンサンブル比較として定量化
  • AF2 アウトプットを MD ワークフローの上流に組み込む標準作法を提示