Explaining how mutations affect AlphaFold predictions
Clore, Thole, Porter et al. (NIH) · DOI: 10.64898/2025.12.30.697132 · Jan 2026
🎯 AlphaFoldのアテンション解析でコンフォメーション選択の「スイッチ残基」を数回の計算で同定するCAAT法を開発
① 背景と動機

AlphaFold2/3は高精度な構造予測を実現したが、その内部意思決定メカニズムは不透明。特にfold-switching proteins(複数コンフォメーションを切り替えるタンパク質)ではAFが誤予測することが多く、「何故そのコンフォメーションが選ばれるか」の理解が重要。

XCL1: AF2/AF3が4/19変異体のみ実験確認のダイマーコンフォメーションを10/19で予測(過剰予測)
既存のattribution法(saliency map等)はAFのtriangle attention構造に特化しておらず、fold-switching検証も不十分
② CAAT法の概要
2コンフォメーションでColabFold実行

Triangle attention tensors (n,h,n,n)×96 を抽出

全モデル・全ヘッド・全recycleで平均化

差分 × BLOSUM62類似度逆数で重み付け

上位N残基 = スイッチ残基候補

網羅的アラニンスキャンの100倍以下のコストで同定可能

③ XCL1での発見

ヒト免疫タンパク質XCL1のコンフォメーション選択は、わずか3残基(位置14, 43, 48)の化学的性質で決まることをCAAT・変異実験で実証。

ダイマー → {I,L,V}
3位置に疎水性残基 → AF2/AF3がダイマー予測
ケモカイン → {D,E,H,K,N,Q,S,T}
3位置に極性/荷電残基 → AF2/AF3がケモカイン予測
④ 複数タンパク質での実験的検証
タンパク質CAAT同定残基実験検証法結果
XCL1Pos. 14, 43, 48AF予測比較3残基パターンで完全説明
KaiBRsL64, V83NMR HSQCL64E/V83S変異でfold-switch確認
RfaH CTDL142, H152CD分光法L142S/H152Lでα→β転換確認
YitI/YodH複数位置AF予測CAAT上位残基の変異で予測変化
反例: XCL1 R23A/R43A は実験で80%→26%ダイマー変化、しかしAFはほぼ変化しない → CAATが「AFの盲点」も正確に識別
⑤ 限界点・残る課題
  • AF学習データバイアスを反映(実験的重要性≠AFの重要性)
  • AF3のdiffusion architectureへの直接適用は不明
  • fold-switching以外タンパク質での汎用性は未検証
  • attentionの高低は相関であり因果ではない
⑥ ケムインフォパイプラインへの応用
lib/docking

CAAТスコアの高い残基をProLIFCalculatorの結合ポケット定義に優先使用。UniDockRunner前段でポケット残基を自動特定し計算効率向上。

lib/md

HBondAnalyzerで観察されたコンフォメーション遷移とCAATスコア残基の対応分析。アロステリック制御機構の解明に活用。

lib/fep

MMGBSAEngineの変異効果予測前にCAAТでAF感度の高い残基を選定し、FEP計算の優先度付けを合理化。

実装要点

ColabFold + forward hook でattentionテンソル取得 → BLOSUM62重み付き差分 → 上位残基出力。数十行で実装可能。

⑦ X投稿用要約

NIHチームがAlphaFoldの「内側」を解明🔬 わずか3残基でタンパク質コンフォメーションが決まる仕組みをattention解析で発見。CAAT法で実験変異不要の重要残基予測が可能に #AlphaFold #構造予測