Explaining how mutations affect AlphaFold predictions

Clore, Thole, Porter et al. (NIH) · DOI: 10.64898/2025.12.30.697132 · Jan 2026

🎯 AlphaFoldのアテンション解析でコンフォメーション選択の「スイッチ残基」を数回の計算で同定するCAAT法を開発

① 背景と動機

AlphaFold2/3は高精度な構造予測を実現したが、その内部意思決定メカニズムは不透明。特にfold-switching proteins（複数コンフォメーションを切り替えるタンパク質）ではAFが誤予測することが多く、「何故そのコンフォメーションが選ばれるか」の理解が重要。

XCL1: AF2/AF3が4/19変異体のみ実験確認のダイマーコンフォメーションを10/19で予測（過剰予測）

既存のattribution法（saliency map等）はAFのtriangle attention構造に特化しておらず、fold-switching検証も不十分

② CAAT法の概要

2コンフォメーションでColabFold実行
↓
Triangle attention tensors (n,h,n,n)×96 を抽出
↓
全モデル・全ヘッド・全recycleで平均化
↓
差分 × BLOSUM62類似度逆数で重み付け
↓
上位N残基 = スイッチ残基候補

網羅的アラニンスキャンの100倍以下のコストで同定可能

③ XCL1での発見

ヒト免疫タンパク質XCL1のコンフォメーション選択は、わずか3残基（位置14, 43, 48）の化学的性質で決まることをCAAT・変異実験で実証。

ダイマー → {I,L,V}

3位置に疎水性残基 → AF2/AF3がダイマー予測

ケモカイン → {D,E,H,K,N,Q,S,T}

3位置に極性/荷電残基 → AF2/AF3がケモカイン予測

④ 複数タンパク質での実験的検証

タンパク質	CAAT同定残基	実験検証法	結果
XCL1	Pos. 14, 43, 48	AF予測比較	3残基パターンで完全説明
KaiBRs	L64, V83	NMR HSQC	L64E/V83S変異でfold-switch確認
RfaH CTD	L142, H152	CD分光法	L142S/H152Lでα→β転換確認
YitI/YodH	複数位置	AF予測	CAAT上位残基の変異で予測変化

反例: XCL1 R23A/R43A は実験で80%→26%ダイマー変化、しかしAFはほぼ変化しない → CAATが「AFの盲点」も正確に識別

⑤ 限界点・残る課題

⑥ ケムインフォパイプラインへの応用

lib/docking

CAAТスコアの高い残基をProLIFCalculatorの結合ポケット定義に優先使用。UniDockRunner前段でポケット残基を自動特定し計算効率向上。

lib/md

HBondAnalyzerで観察されたコンフォメーション遷移とCAATスコア残基の対応分析。アロステリック制御機構の解明に活用。

lib/fep

MMGBSAEngineの変異効果予測前にCAAТでAF感度の高い残基を選定し、FEP計算の優先度付けを合理化。

実装要点

ColabFold + forward hook でattentionテンソル取得 → BLOSUM62重み付き差分 → 上位残基出力。数十行で実装可能。

⑦ X投稿用要約

NIHチームがAlphaFoldの「内側」を解明🔬 わずか3残基でタンパク質コンフォメーションが決まる仕組みをattention解析で発見。CAAT法で実験変異不要の重要残基予測が可能に #AlphaFold #構造予測