PEGASUS: Cyclic Peptide AI Permeability

PEGASUS: Unlocking Polarity in Cell-Permeable Cyclic Peptides Using AI Models Built on Massively Parallel Biological Assays

Baker, Asher et al. — J. Med. Chem. 2025 | DOI: 10.1021/acs.jmedchem.5c01836

🎯 27億配列のmRNAディスプレイ×GFN-FF MDでPEGASUS AIを訓練。極性フラグメント≥2個の環状ペプチドで初めてin vitro膜透過性を達成した。

① 背景と課題

環状ペプチド（MW 1000〜2000 Da）はPPI阻害など低分子では届かない標的に有望だが、細胞膜透過性と水溶性の同時充足が困難。2002〜2024年のFDA承認17品目で細胞内標的に効くのは1品目のみ（ボクロスポリン）。

従来ヒューリスティック: 「疎水性アミノ酸を最大化」という設計原則が支配的

既存予測モデル: ~1,000件の実験データのみ → 極性空間への外挿が不可能

訓練データバイアス: 学習データの96%がイオン化側鎖なし・水酸基3個未満の疎水性偏重

→ 27億配列の大規模プロキシアッセイ + QM記述子で極性設計空間を開拓

② 1910 PPA パイプライン

③ 本研究で示したこと

④ 主な結果 (a) データ規模比較

④ 主な結果 (b) logD 予測精度

④ 主な結果 (c) デノボ設計ヒット率

④ 主な結果 (d) PEGASUS スイート構成

GFN-FF MTD: 水/ヘキサン各10本×100ps → xTBでQM記述子（IMHB・SASA・Rg等）計算

⑤ テイクホームメッセージ

🧪 1910 PPA: 27億配列
mRNAディスプレイ+C18分画で超高スループット疎水性プロファイリング。従来比×270万の訓練データ。

🎯 ゼロショット logD 予測
実験logD測定なしにRp=0.92達成。MAE=0.60はcLogP(3.45)・CDD Vault(1.93)を大幅に上回る。

🌟 極性設計空間の開拓
POLルールで最適logD範囲を同定。デノボ設計33件中24%がPapp≥0.4達成。従来ヒューリスティック打破。

⚠️ 現実的な限界
mRNAディスプレイは特殊設備が必要。設計した76%は閾値以下。1910PPAは疎水性プロキシ（直接透過性測定でない）。

ケムインフォマティクスパイプラインへの適用

適用先	ユースケース
lib/docking	GFN-FF MTD記述子パイプライン → 環状ペプチドlogD/透過性フィルター
lib/molgen	POLルールをMolgenYamlスコアラー制約として環状ペプチド生成を制御
lib/docking	PEGASUS-HTSをUniDockRunnerの前段スクリーニングフィルターとして統合

xTBパッケージ(GFN-FF/GFN2-xTB)はオープンソース。ALPBモデルで明示溶媒比約110倍高速化

本研究のインパクト