PEGASUS: Unlocking Polarity in Cell-Permeable Cyclic Peptides Using AI Models Built on Massively Parallel Biological Assays
Baker, Asher et al. — J. Med. Chem. 2025 | DOI: 10.1021/acs.jmedchem.5c01836
🎯 27億配列のmRNAディスプレイ×GFN-FF MDでPEGASUS AIを訓練。極性フラグメント≥2個の環状ペプチドで初めてin vitro膜透過性を達成した。
① 背景と課題

環状ペプチド(MW 1000〜2000 Da)はPPI阻害など低分子では届かない標的に有望だが、細胞膜透過性と水溶性の同時充足が困難。2002〜2024年のFDA承認17品目で細胞内標的に効くのは1品目のみ(ボクロスポリン)。

従来ヒューリスティック: 「疎水性アミノ酸を最大化」という設計原則が支配的
既存予測モデル: ~1,000件の実験データのみ → 極性空間への外挿が不可能
訓練データバイアス: 学習データの96%がイオン化側鎖なし・水酸基3個未満の疎水性偏重

→ 27億配列の大規模プロキシアッセイ + QM記述子で極性設計空間を開拓

② 1910 PPA パイプライン
1910 PPA パイプライン 合成ライブラリ DNA 多様性 1.1×10¹² 種 mRNA ディスプレイ発現 cDNA-mRNA-ペプチド融合体 C18 磁気ビーズ捕捉 アセトニトリル 5フラクション溶出 NGS 定量 × 9ラウンド富化 有効リード: 2.7B 配列 F値付与 → AI 訓練データ ΔPeakC18 = logD 代替指標
③ 本研究で示したこと
  • ゼロショット学習でChromlogD7.4予測 Rp=0.92 (vs cLogP: Rp=0.69)
  • MAE=0.60 (PEGASUS) vs 3.45 (cLogP) vs 1.93 (CDD Vault logD)
  • プレスクリーニングで平均ヒット率13.1%向上(後向き検証)
  • デノボ設計33件のうち24%がPapp≥0.4×10⁻⁶ cm/s(Caco-2/MDCK)
  • POLルール: 透過性に最適なlogD範囲を同定し疎水性偏重を打破
④ 主な結果 (a) データ規模比較
訓練データ規模の比較 2.7B 配列 1910 PPA ~1,000 件 実験データ 10³ 10⁶ 10⁹ 配列数 (log scale) ×2,700,000 規模の差 従来モデルは ~96% が疎水性バイアス PPAで極性空間をカバー
④ 主な結果 (b) logD 予測精度
logD 予測精度 (MAE, 低いほど良い) 1 2 3 4 MAE (logD 単位) 0.60 Rp=0.92 PEGASUS logD 3.45 Rp=0.69 cLogP 1.93 CDD Vault logD ★ Best ゼロショット学習(実験logD不要)
④ 主な結果 (c) デノボ設計ヒット率
デノボ設計 33件の in vitro 透過性結果 100% (n=33) 全候補 24% (n=8) Papp ≥ 0.4×10⁻⁶ cm/s 12% (n=4) Papp ≥ 1.0×10⁻⁶ cm/s 🌟 極性フラグメント2個超で初めて達成 従来の疎水性設計ヒューリスティックを打破
④ 主な結果 (d) PEGASUS スイート構成
モデル入力機能
PEGASUS logDΔPeakC18logD代替予測 (Rp=0.92)
PEGASUS-HTS1910 PPA透過性スクリーニング
PEGASUS-QMHTS+MTD QMマルチモーダル予測
CycPepVAE-デノボ環状ペプチド生成

GFN-FF MTD: 水/ヘキサン各10本×100ps → xTBでQM記述子(IMHB・SASA・Rg等)計算

⑤ テイクホームメッセージ
🧪 1910 PPA: 27億配列
mRNAディスプレイ+C18分画で超高スループット疎水性プロファイリング。従来比×270万の訓練データ。
🎯 ゼロショット logD 予測
実験logD測定なしにRp=0.92達成。MAE=0.60はcLogP(3.45)・CDD Vault(1.93)を大幅に上回る。
🌟 極性設計空間の開拓
POLルールで最適logD範囲を同定。デノボ設計33件中24%がPapp≥0.4達成。従来ヒューリスティック打破。
⚠️ 現実的な限界
mRNAディスプレイは特殊設備が必要。設計した76%は閾値以下。1910PPAは疎水性プロキシ(直接透過性測定でない)。
ケムインフォマティクスパイプラインへの適用
適用先ユースケース
lib/dockingGFN-FF MTD記述子パイプライン → 環状ペプチドlogD/透過性フィルター
lib/molgenPOLルールをMolgenYamlスコアラー制約として環状ペプチド生成を制御
lib/dockingPEGASUS-HTSをUniDockRunnerの前段スクリーニングフィルターとして統合

xTBパッケージ(GFN-FF/GFN2-xTB)はオープンソース。ALPBモデルで明示溶媒比約110倍高速化

本研究のインパクト
  • • 環状ペプチドの細胞透過性設計における疎水性パラダイムを計算科学で打破
  • • 極性・イオン化フラグメントを含む新規化学空間の探索を初めて実証
  • • GFN-FF MTD + AI組み合わせが実験スクリーニングの代替として機能することを示した