Conservation of Hot Spots and Ligand Binding Sites in Protein Models by AlphaFold2
J. Chem. Inf. Model. | Published 2024 | DOI: 10.1021/acs.jcim.3c01761
AF2モデルへのプロテインマッピングはドッキングより精度劣化に頑健。ドメイン単体生成+複数シードでX線並みのホットスポット予測を達成。
① 背景と課題

AlphaFold2 はタンパク質の主鎖構造を高精度に予測するが、創薬応用、特にリガンド結合部位の保存性については依然議論がある。CASP15 を含む複数の先行研究は、AF2 モデルへの直接ドッキングが X 線結晶構造と比べ大きく成功率を落とすことを報告してきた。

直接ドッキングは AF2 の局所コンフォメーション誤差(側鎖配向・ループ位置)に敏感で、特にリガンドポーズ精度(RMSD ≤ 2 Å)が大幅に低下する。
多ドメインタンパク質では inter-domain 相対配置の誤差が結合部位の同定をさらに阻害する。

→ ドッキングより粗解像度の「ホットスポット検出」なら AF2 モデルでも実用的精度が得られないかを体系評価する。

② 手法の概要:プロテインマッピング on AF2
  • FTMap/FTDock ベースのフラグメント探索(エタノール・アセトン・ベンゼン等16種のプローブ)
  • プローブ密集クラスター = ホットスポットとして同定
  • 多ドメイン蛋白は ドメイン単体で AF2 生成し inter-domain 誤差を排除
  • 複数ランダムシードで AF2 アンサンブル → 低 pLDDT 領域の不確実性を考慮
処理パイプライン AF2 全長 予測 ドメイン分割 + AF2 再生成 複数シード アンサンブル FTMap ホットスポット = プローブクラスター X線結合部位 ≤ 4 Å を成功判定
③ 本研究で示したこと
  • プロテインマッピングは AF2 局所誤差に対しドッキングより頑健
  • 全長 AF2 のみでは X 線比 5〜10% の成功率低下
  • ドメイン単体生成+複数シードで X 線並みの精度を達成
  • 多ドメイン蛋白では精度低下が >10% と顕著
  • 低 pLDDT 領域はドメイン分割でも回復しない場合あり
④ (a) ホットスポット同定成功率(4 Å基準)
条件別 success rate (X線=基準) 100% 75% 50% 25% X線 100% AF2全長 ~92% 多ドメイン (全長) ~85% ドメイン 単体 ~96% +複数 シード ~99%

ドメイン分割+シードアンサンブルが X 線基準を回復させる。

④ (b) ドッキング vs マッピング感度
局所RMSD vs 成功率(概念図) 側鎖/ループ RMSD (Å) success rate 100% 0% マッピング ドッキング AF2 誤差に対する 頑健性の差

フラグメントクラスタは正確なポーズを要求しないため AF2 誤差に強い。

④ (c) 多ドメイン蛋白での精度低下
蛋白タイプ全長 AF2ドメイン単体差分
単一ドメイン~93%~95%+2%
多ドメイン~83%~95%+12%
低 pLDDT 領域含~78%~84%+6%
inter-domain 相対配置誤差はドメイン単体生成で実効的に解決可能。

低 pLDDT は分割しても完全には回復しない。

④ (d) シードアンサンブル効果
シード数 vs カバレッジ ランダムシード数 (n) ホットスポット検出率 100% 75% 50% 1 3 5 10 20 75% 88% 95% 98% X線並

n≈5〜10 シードで X 線並みに飽和。低 pLDDT 領域でも不確実性を捕捉。

⑤ テイクホームメッセージ
頑健な代替手法

ホットスポット検出はリガンドポーズを要求しないため、AF2 の局所誤差に対しドッキングより 1 桁感度が低い。

ドメイン単体生成が鍵

多ドメイン蛋白での精度低下(>10%)は inter-domain 配置誤差由来。ドメイン分割で X 線並みに回復。

シードアンサンブルの実用性

5〜10 シードで AF2 確信度の低い領域もカバー。コスト見合いで現実的に運用可能。

ポーズ予測には別工程が必要

マッピングは結合部位「位置」のみ。ポーズ精度問題は依然残り、後段の精緻ドッキング/MD が必要。

応用補足:パイプラインへの実装
  • lib/docking: AF2 → ドメイン分割 → FTMap 呼び出し → fpocket と統合してホットスポット領域を docking grid 中心に
  • UniDockRunner にホットスポットスコアでターゲット選別ステップを追加
  • ProLIFCalculator のリファレンス相互作用設計に hot spot 情報を活用
  • 低 pLDDT 領域のフラグ付けでリスク見える化
インパクト
  • AF2 構造を SBVS の出発点として実用化する具体的レシピ
  • 多ドメイン創薬標的への AF2 適用ガイドライン
  • FTMap+fpocket をオープンに使えるホットスポット解析基盤