PROTACs in Targeted Protein Degradation: Advances in Development and AI-Enhanced Drug Discovery
European Journal of Medicinal Chemistry Reports | 2026年3月 | DOI: 10.1016/j.ejmcr.2026.100332
PROTAC × AI 最新レビュー:リンカーRL/VAE生成、三元複合体cofolding、DC50/ADMET ML予測を体系化し、2025-2026年の臨床PROTAC動向を更新
① 背景と課題:PROTAC設計の三重苦

PROTAC(PROteolysis TArgeting Chimera)は標的タンパク(PoI)リガンド・E3リガーゼ(CRBN/VHL等)リガンド・両者を繋ぐリンカーの三要素から成り、ユビキチン-プロテアソーム系(UPS)を介して標的タンパクを分解する次世代モダリティである。占有駆動型の従来阻害剤と異なりイベント駆動型・触媒的に機能するため、undruggableターゲットへの適用が期待される。

三元複合体形成:PoI-PROTAC-E3が協同的(αパラメータ)に組まれる必要があり、結合親和性のみでは分解効率(DC50/Dmax)を予測できない
リンカー設計空間の爆発:原子数・回転自由度・剛直性・極性の組合せが膨大で、合成試行錯誤に依存した経験則最適化が現状
分子量増大に伴うADMET悪化:MW 700-1100 Daが典型でRule of 5を逸脱、膜透過性・代謝安定性・hERGリスクが課題

→ 2024-2026年のAlphaFold2/Boltz-2、拡散モデル、GNNなど最新AI手法でPROTAC開発を体系的に加速できないかを総覧する

② 手法の概要:AI応用の5層スタック
  • ワーヘッド探索:LBVS/SBVSによるPoIリガンド・E3リガンド同定
  • リンカー設計:RL(PROTAC-INVENT)/ VAE(DeLinker)/ 拡散モデル
  • 三元複合体予測:AF-Multimer、Chai-1、Boltz-2、専用GNN
  • ADMET予測:CaLPP(膜透過)、代謝安定性、hERG分類器
  • 分解効率予測:DC50/Dmax の QSAR + GNN
PROTAC設計AIパイプライン PoI/E3 ワーヘッド リンカー RL/VAE/拡散 三元複合体 cofolding ADMET 分類器 DC50 / Dmax 予測 (GNN + QSAR) 分解効率を統合的に評価 合成・実験検証 → ループ反復 5段階のAI活用層を設計サイクルに統合
③ 本研究で示したこと
  • 2024-2026年の最新AI手法(Boltz-2・Chai-1・拡散モデル・専用GNN)をPROTAC設計の各段階別に整理
  • 臨床PROTAC一覧を更新:ARV-110/471、bavdegalutamide、CFT8919等のPhase 2以降を網羅
  • 三元複合体協同性(αパラメータ)の計算予測の困難性を整理
  • リソソーム系デグレーダー(LYTAC・ATTEC)への AI 応用が初期段階であることを指摘
  • 公開DC50/Dmaxデータが数千件規模に留まり、過学習リスクが高い現状を提示
④(a) リンカー生成AIの設計戦略
主要リンカー生成モデルの特性 RL+RNN PROTAC- INVENT VAE DeLinker (3D条件) 拡散モデル Diffusion 2024-26 設計自由度
RL:両端SMILES条件付きトークン生成。VAE:接続点3D座標条件。拡散:3D配座を直接生成
④(b) PROTAC AI応用5領域の成熟度
領域別の研究成熟度(レーダー) ワーヘッド探索 リンカー設計 三元複合体 ADMET予測 DC50/Dmax 外周=研究蓄積大、内側=未成熟
④(c) 臨床段階の代表PROTAC
化合物標的段階
ARV-110AR(前立腺癌)Phase 2
ARV-471ER(乳癌)Phase 3
bavdegalutamideARPhase 2
CFT8919EGFR L858RPhase 1/2
700-1100 Da
PROTAC典型分子量レンジ(Ro5逸脱領域)
数千件
公開DC50/Dmaxデータ件数(過学習リスク)
④(d) 三元複合体構造予測モデル
cofoldingモデルの位置づけ 2021 2023 2024 2025-26 AF2 PoI構造 AF-Multi PoI-E3 Chai-1 小分子対応 Boltz-2 三元複合体 縦軸=精度&PROTAC直接対応 ↑
専用GNNはα協同性予測を試行も、定量予測は依然困難
⑤ テイクホームメッセージ
5段階スタック化
ワーヘッド探索→リンカー設計→三元複合体予測→ADMET→DC50/Dmax予測の5層でAI応用が体系化された。
リンカー生成は3流派
RL(PROTAC-INVENT)・VAE(DeLinker)・拡散モデルが並立。3D条件付き生成が2024-26年の主流。
cofolding時代の到来
Boltz-2・Chai-1がPROTAC三元複合体を直接予測する初期段階に到達、AF-Multimerからの精度向上が顕著。
α協同性とデータ枯渇
DC50/Dmax予測は数千件データの過学習リスクとα協同性の理論未解明が二大ボトルネック。
臨床トランジション加速
ARV-471(Phase 3)・ARV-110・CFT8919などPhase 2以降が並走、AI支援設計のリアルワールド検証段階。
次世代デグレーダーへ拡張
LYTAC/ATTECなどリソソーム・オートファジー系デグレーダーへのAI応用は初期段階で大きな研究空白。
応用補足:lib/* への統合

lib/molgen
MolgenYamlにPROTAC-INVENT型RLリンカー生成器を統合し、両端SMILES条件付きでde novo PROTAC設計を可能にする。

lib/docking
UniDockRunnerを三元複合体(PoI-PROTAC-E3)対応に拡張、ProLIFCalculatorで両界面のH-bond/疎水性接触を評価するPROTAC専用フィルタを構築。

lib/fep
MMGBSAEngineの評価軸にα協同性指標を追加、三元複合体安定化エネルギーを定量化。

インパクト
  • PROTAC開発における AI 応用の5段階マップを提示し、今後の研究投資の優先度判断材料となる
  • 2024-26年の最新モデル(Boltz-2・拡散モデル)を体系整理した最新リファレンス
  • LYTAC/ATTECなど次世代デグレーダーへの AI 応用の研究空白を明確化