Structural Consequences of Introducing Multiple Ionizable Residues in a Protein with a Highly Charged Surface
DOI: 10.64898/2026.03.11.711144
Category: computational_chemistry
Published: 2026-03
Goal: 4点イオン化置換 U1A 変異体の劇的な構造再編 (αhelix×2 / 三量体化) を提示し、AF2 / RF2 / OmegaFold / ESMFold が一致して予測失敗することを実証
1
背景と課題
AI構造予測モデル (AF2 等) は CASP15 で実験精度に肉薄したが、
埋没イオン化残基
を含む静電駆動の折り畳みでは PDB 訓練分布が薄く、 物理化学的破綻が懸念されてきた。
U1A (102 aa) の表面負電荷クラスタ E11/E12/D90/D92 に注目
これら4残基を
K (正電荷)
に一括反転させたら何が起きるか?
静電破綻の実験的証拠と AI 予測の同時評価が不在
2
手法の概要
Wet:
4xK 変異体 (E11K/E12K/D90K/D92K) を E.coli 発現 → X線 1.8 Å、 CD で α/β 含量、SEC でオリゴマー状態を測定。
Dry:
同一配列を 4 種 AI 構造予測器に投入し、 実験構造 / 野生型 (PDB:1URN) との RMSD と pLDDT を比較。
ColabFold (AF2) / RoseTTAFold2
OmegaFold / ESMFold (シングルシーケンス系)
3
本研究で示したこと
4点正電荷置換は U1A の三次構造を
根本的に再編
: αhelix 含量 ≒ 2 倍、可溶性三量体形成、長い α-helix と N-C ドメイン間相互作用を持つ
新規 fold
が出現。 一方、
4 つの AI モデルは全て野生型と RMSD < 1 Å の予測
を返し、 実験構造とは RMSD > 5 Å。 しかも pLDDT > 80 と
高信頼度で誤予測
。
4
主な結果
a
αhelix 含量 (CD) が 2 倍に倍増
0
20
40
60
α-helix (%)
25%
WT U1A
52%
4xK mutant
x2
CD分光: 4xK で α-helix 含量が約 2 倍に増加。同時に SEC で三量体ピークを観測。
b
4 AI モデル全てが WT 側へ"張り付く"
0
2
4
6
8
10
RMSD vs experimental Cryst (Å)
0
1
2
RMSD vs WT (Å)
FAIL ZONE
AF2 (5.4,0.7)
RF2 (6.2,0.4)
OmegaFold (6.8,0.85)
ESMFold (6.5,1.0)
Exp 4xK
予測構造は WT (RMSD<1Å) に張り付き、実験 4xK 構造とは RMSD > 5 Å。
c
高 pLDDT で誤る "confident wrong"
50-60
60-70
70-80
80-90
90-100
4%
7%
18%
41%
30%
pLDDT (per-residue confidence)
71% of residues > 80
残基の
71%
が pLDDT>80。誤予測なのに信頼度高い → ユーザーが見抜きづらい。
d
失敗パターン: 静電寄与の欠落
Sequence
+4xK
AF2 / RF2 /
OmegaFold / ESMFold
WT-like
RMSD<1Å
Missing inductive bias
埋没イオン化残基の Coulomb 罰則 / 訓練 PDB に統計的に希少
Reality
α x 2 + 三量体
大きな乖離
AI 予測
≒ WT
原因仮説:
埋没イオン化残基
を訓練分布で十分に学べていない (PDB 統計の偏り)。
5
テイクホームメッセージ
!
配列上は穏やかな
4 残基置換
でも、実際は α-helix が
2 倍
・
三量体
に大変身する一方、AF2/RF2/OmegaFold/ESMFold は
高信頼で WT そっくり
を出力する ── AI 構造予測を創薬・変異設計に使う際は、
埋没イオン化残基や強い静電摂動を含む系では実験的検証を必ず併走
させ、pLDDT を盲信しないこと。