Structural Consequences of Introducing Multiple Ionizable Residues in a Protein with a Highly Charged Surface
DOI: 10.64898/2026.03.11.711144 Category: computational_chemistry Published: 2026-03
Goal: 4点イオン化置換 U1A 変異体の劇的な構造再編 (αhelix×2 / 三量体化) を提示し、AF2 / RF2 / OmegaFold / ESMFold が一致して予測失敗することを実証

1背景と課題

AI構造予測モデル (AF2 等) は CASP15 で実験精度に肉薄したが、 埋没イオン化残基を含む静電駆動の折り畳みでは PDB 訓練分布が薄く、 物理化学的破綻が懸念されてきた。
  • U1A (102 aa) の表面負電荷クラスタ E11/E12/D90/D92 に注目
  • これら4残基を K (正電荷) に一括反転させたら何が起きるか?
  • 静電破綻の実験的証拠と AI 予測の同時評価が不在

2手法の概要

Wet: 4xK 変異体 (E11K/E12K/D90K/D92K) を E.coli 発現 → X線 1.8 Å、 CD で α/β 含量、SEC でオリゴマー状態を測定。
Dry: 同一配列を 4 種 AI 構造予測器に投入し、 実験構造 / 野生型 (PDB:1URN) との RMSD と pLDDT を比較。
  • ColabFold (AF2) / RoseTTAFold2
  • OmegaFold / ESMFold (シングルシーケンス系)

3本研究で示したこと

4点正電荷置換は U1A の三次構造を 根本的に再編: αhelix 含量 ≒ 2 倍、可溶性三量体形成、長い α-helix と N-C ドメイン間相互作用を持つ 新規 fold が出現。 一方、4 つの AI モデルは全て野生型と RMSD < 1 Å の予測を返し、 実験構造とは RMSD > 5 Å。 しかも pLDDT > 80 と 高信頼度で誤予測

4主な結果

a
αhelix 含量 (CD) が 2 倍に倍増
0 20 40 60 α-helix (%) 25% WT U1A 52% 4xK mutant x2
CD分光: 4xK で α-helix 含量が約 2 倍に増加。同時に SEC で三量体ピークを観測。
b
4 AI モデル全てが WT 側へ"張り付く"
0 2 4 6 8 10 RMSD vs experimental Cryst (Å) 0 1 2 RMSD vs WT (Å) FAIL ZONE AF2 (5.4,0.7) RF2 (6.2,0.4) OmegaFold (6.8,0.85) ESMFold (6.5,1.0) Exp 4xK
予測構造は WT (RMSD<1Å) に張り付き、実験 4xK 構造とは RMSD > 5 Å。
c
高 pLDDT で誤る "confident wrong"
50-60 60-70 70-80 80-90 90-100 4% 7% 18% 41% 30% pLDDT (per-residue confidence) 71% of residues > 80
残基の 71% が pLDDT>80。誤予測なのに信頼度高い → ユーザーが見抜きづらい。
d
失敗パターン: 静電寄与の欠落
Sequence +4xK AF2 / RF2 / OmegaFold / ESMFold WT-like RMSD<1Å Missing inductive bias 埋没イオン化残基の Coulomb 罰則 / 訓練 PDB に統計的に希少 Reality α x 2 + 三量体 大きな乖離 AI 予測 ≒ WT
原因仮説: 埋没イオン化残基を訓練分布で十分に学べていない (PDB 統計の偏り)。

5テイクホームメッセージ

!
配列上は穏やかな 4 残基置換 でも、実際は α-helix が 2 倍三量体に大変身する一方、AF2/RF2/OmegaFold/ESMFold は 高信頼で WT そっくり を出力する ── AI 構造予測を創薬・変異設計に使う際は、埋没イオン化残基や強い静電摂動を含む系では実験的検証を必ず併走させ、pLDDT を盲信しないこと。