AI-aided Drug Development for Protein Degraders

AI-aided Drug Development for Protein Degraders: Design, Lead Identification, and Optimization

Karki, Pokharela, Zaliani, Huchting, Gribbon (Fraunhofer ITMP/CIMD) | Annual Reports in Medicinal Chemistry Vol.65, 2025 | DOI: 10.1016/bs.armc.2025.09.001

🎯 PROTAC・分子グルー・HyTなどのターゲットプロテインデグレーダー設計にAI/MLを活用する包括的レビュー。RLリンカー設計・三元複合体予測・ADME予測を体系化する。

① 背景と課題

PROTAC等のタンパク質分解誘導薬（TPD）は「undruggable」標的へのアプローチとして急成長。ARV-110のFDA承認を受け設計の合理化が急務。従来のロールベース最適化は多体系の複雑性に限界。

PROTACデータ不足: PROTAC-DBの公開活性データは数千件規模で大規模DL訓練には不十分

三元複合体の柔軟性: PoI・E3リガーゼ・リンカーの動的相互作用をMLで定量的に捉えることが困難

→ RL・AlphaFold2 cofolding・ADME ML予測でTPD設計を加速する

② 手法: RLによるPROTACリンカー設計

② 手法: 三元複合体予測 & ADME

三元複合体予測: AlphaFold-Multimer・Chai-1・Boltz-2などcofolding modelsが台頭。GNNスコアラーによる三元複合体専用評価も進展中。

ADME予測: CaLPP（GNNベースBBB/Pampa透過性予測）、DC50/Dmax回帰モデル（QSAR+ML）。PROTAC-DBが訓練データ基盤。

ARV-110

FDA承認アンドロゲン受容体PROTAC（ベンチマーク事例）

③ 本研究で示したこと（要点）

RLリンカー設計（DQN/多目的RL）をTPD設計の中核として体系化
PROTAC・分子グルー・HyT・リソソーム系を網羅する包括的AIレビュー
AlphaFold2/Chai-1/Boltz-2による三元複合体cofoldingの現状と限界を整理
ADME/分解効率ML予測とPROTAC-DBエコシステムの現状を俯瞰

④ 主な結果 (a) RLアーキテクチャ比較

RLモデル	特徴	適用
DQN	安定した探索	リンカー生成
アクタークリティック	連続行動空間	3D最適化
多目的RL（Pareto）	SA+活性同時最適化	PROTAC MPO

④ 主な結果 (b) TPDタイプ別AI難易度

④ 主な結果 (c) 三元複合体予測ツール

ツール	種別	精度
Glide SP/XP + Rosetta	剛体/柔軟ドッキング	基準
AlphaFold-Multimer	cofolding	高（定性）
Chai-1 / Boltz-2	cofolding	最先端
GNNスコアラー	三元複合体専用ML	研究段階

④ 主な結果 (d) lib への適用ロードマップ

lib/molgen

33変換ルール × RL → PROTACリンカー最適化ループ実装

lib/docking

UniDockRunnerを三元複合体ドッキングに拡張 + ProLIF接触FP評価

lib/fep

DC50/Dmax予測モデルを分解効率オラクルとして統合

⑤ テイクホームメッセージ

RLリンカー設計は実装可能段階
33の医薬化学変換ルールをMolgenYamlのアクション空間として実装し、三元複合体ドッキングを報酬に使う

Chai-1/Boltz-2が三元複合体予測を変える
cofoldingで三元複合体構造を直接予測できる時代に。lib/dockingの次期拡張目標として最優先

分子グルーはデータ少なくFS学習が鍵
フューショット学習・転移学習を活用したデグレーダー設計は今後の研究方向

PROTAC-DBを活用した訓練データ整備
DC50/Dmax予測モデルの構築にPROTAC-DBは必須データソース

本レビューのカバー範囲

領域	AIアプローチ	成熟度
PROTACリンカー	多目的RL	★★★★☆
三元複合体予測	AlphaFold cofolding	★★★☆☆
ADME/透過性	GNN（CaLPP）	★★★☆☆
分子グルー設計	FS学習・転移学習	★★☆☆☆

本研究のインパクト

RLベースPROTACリンカー最適化をlib/molgenに実装するための設計指針が得られる
UniDockRunner三元複合体拡張 + ProLIF FPでlib/dockingのTPD評価能力を大幅強化
PROTAC-DBを活用したDC50予測オラクルをlib/fepに追加することで分解効率推定が可能