SHARP: Fragment-Based Hierarchical RL for Synthesizable Multi-objective Molecular Optimization
Kim, Ryu, Lee, Lee, Park & Seok (Seoul National Univ.) · DOI:10.1021/acs.jcim.5c01699 · J. Chem. Inf. Model. 2025, 65, 11601–11619
🎯 BRICSフラグメントRL×SEM合成マスク×複合報酬でVina score -8.5。専門家評価:15中12分子合成可能。
① SHARPアーキテクチャ:3コンポーネントの相乗効果
【第1段RL】アクション種別選択: 追加 / 削除 / 置換

【第2段RL】フラグメント選択(ChEMBL34 BRICS分解ライブラリから)

【SEM】合成可能性推定モデル → アクションマスク(合成困難フラグメントを禁止)

【複合報酬】Vinaスコア × ファルマコフォアマッチング × SASA(分子サイズ制御)

原子レベル自己回帰の「局所最適解収束」と「合成可能性無視」という2課題を同時解決

② de novoデザイン比較(13受容体)
モデルVina(↓)成功率(%)合成可能率(%)
SHARP-8.52730.272.7
Pocket2Mol-6.43720.565.9
TargetDiff-6.96012.853.6
LiGAN-7.64014.275.5
DiffBP-6.2378.580.5

専門家逆合成評価: 15分子中12分子合成可能(8分子は容易)

③ アブレーション実験(SEMの効果)
SHARP(フル): 合成可能率 72.7% / Vina -8.527
SHARP-SEM(SEMなし): 合成可能率 5.6%(急落)/ Vina -11.478(高くなるが巨大分子)
SHARP-REW(報酬なし): 成功率 62.9% / Vina -9.306
SHARP-ACT(階層なし): 成功率 16.3% / 削除・置換なしでは探索不足

→ 3コンポーネント全てが不可欠であることを実証

④ 4タスクリード最適化(scaffold hopping強み)
タスクVina成功率(%)Recovery率(%)
Scaffold hopping40.6%42.8%
Side chain decoration46.7%50.5% (sim)
Fragment growing77.2%(success)
Linker design89.1%(success)

TargetDiffのscaffold hopping recovery率14.4%に対してSHARPは42.8%(3倍)

⑤ 報酬関数の設計
  • Vinaドッキングスコア: 結合親和性を直接評価
  • ファルマコフォアマッチング: 特定HBD/HBA/疎水性特徴点との整合性
  • SASA: 分子サイズを制御し巨大分子生成を防止
制限: RL学習に多数のドッキング評価が必要(計算コスト高)。重みはターゲット依存でチューニングが必要。
⑥ パイプライン統合案
  • lib/molgen: SHARPをRLオプティマイザとして統合。UniDockRunnerが報酬計算のバックエンド。
  • lib/docking: Multi-component reward(Vina+Pharm+SASA)をUniDockRunnerの評価軸に拡張。
  • lib/fep: SEMをMMGBSAEngine前段の合成可能性フィルタとして活用。