AI-aided Drug Development for Protein Degraders: Design, Lead Identification, and Optimization
Karki, Pokharela, Zaliani, Huchting, Gribbon (Fraunhofer ITMP/CIMD) | Annual Reports in Medicinal Chemistry Vol.65, 2025 | DOI: 10.1016/bs.armc.2025.09.001
🎯 PROTAC・分子グルー・HyTなどのターゲットプロテインデグレーダー設計にAI/MLを活用する包括的レビュー。RLリンカー設計・三元複合体予測・ADME予測を体系化する。
① 背景と課題

PROTAC等のタンパク質分解誘導薬(TPD)は「undruggable」標的へのアプローチとして急成長。ARV-110のFDA承認を受け設計の合理化が急務。従来のロールベース最適化は多体系の複雑性に限界。

PROTACデータ不足: PROTAC-DBの公開活性データは数千件規模で大規模DL訓練には不十分
三元複合体の柔軟性: PoI・E3リガーゼ・リンカーの動的相互作用をMLで定量的に捉えることが困難

→ RL・AlphaFold2 cofolding・ADME ML予測でTPD設計を加速する

② 手法: RLによるPROTACリンカー設計
RLリンカー最適化ループ 現分子グラフ(状態) 33変換ルール(行動) SA+QED+Dock(報酬) 多目的RL (Pareto): SA/QED + 活性の同時最適化 PoI + E3リガンド固定 → リンカーのみRL最適化 DQN / アクタークリティック / 多目的RL
② 手法: 三元複合体予測 & ADME

三元複合体予測: AlphaFold-Multimer・Chai-1・Boltz-2などcofolding modelsが台頭。GNNスコアラーによる三元複合体専用評価も進展中。

ADME予測: CaLPP(GNNベースBBB/Pampa透過性予測)、DC50/Dmax回帰モデル(QSAR+ML)。PROTAC-DBが訓練データ基盤。

ARV-110
FDA承認アンドロゲン受容体PROTAC(ベンチマーク事例)
③ 本研究で示したこと(要点)
  • RLリンカー設計(DQN/多目的RL)をTPD設計の中核として体系化
  • PROTAC・分子グルー・HyT・リソソーム系を網羅する包括的AIレビュー
  • AlphaFold2/Chai-1/Boltz-2による三元複合体cofoldingの現状と限界を整理
  • ADME/分解効率ML予測とPROTAC-DBエコシステムの現状を俯瞰
④ 主な結果 (a) RLアーキテクチャ比較
RLモデル特徴適用
DQN安定した探索リンカー生成
アクタークリティック連続行動空間3D最適化
多目的RL(Pareto)SA+活性同時最適化PROTAC MPO
④ 主な結果 (b) TPDタイプ別AI難易度
TPDタイプ × AIデータ充足度 PROTAC HyT 分子グルー リソソーム 最多データ 最少データ
④ 主な結果 (c) 三元複合体予測ツール
ツール種別精度
Glide SP/XP + Rosetta剛体/柔軟ドッキング基準
AlphaFold-Multimercofolding高(定性)
Chai-1 / Boltz-2cofolding最先端
GNNスコアラー三元複合体専用ML研究段階
④ 主な結果 (d) lib への適用ロードマップ
lib/molgen
33変換ルール × RL → PROTACリンカー最適化ループ実装
lib/docking
UniDockRunnerを三元複合体ドッキングに拡張 + ProLIF接触FP評価
lib/fep
DC50/Dmax予測モデルを分解効率オラクルとして統合
⑤ テイクホームメッセージ
RLリンカー設計は実装可能段階
33の医薬化学変換ルールをMolgenYamlのアクション空間として実装し、三元複合体ドッキングを報酬に使う
Chai-1/Boltz-2が三元複合体予測を変える
cofoldingで三元複合体構造を直接予測できる時代に。lib/dockingの次期拡張目標として最優先
分子グルーはデータ少なくFS学習が鍵
フューショット学習・転移学習を活用したデグレーダー設計は今後の研究方向
PROTAC-DBを活用した訓練データ整備
DC50/Dmax予測モデルの構築にPROTAC-DBは必須データソース
本レビューのカバー範囲
領域AIアプローチ成熟度
PROTACリンカー多目的RL★★★★☆
三元複合体予測AlphaFold cofolding★★★☆☆
ADME/透過性GNN(CaLPP)★★★☆☆
分子グルー設計FS学習・転移学習★★☆☆☆
本研究のインパクト
  • RLベースPROTACリンカー最適化をlib/molgenに実装するための設計指針が得られる
  • UniDockRunner三元複合体拡張 + ProLIF FPでlib/dockingのTPD評価能力を大幅強化
  • PROTAC-DBを活用したDC50予測オラクルをlib/fepに追加することで分解効率推定が可能