DiffDec: Structure-Aware Scaffold Decoration with an End-to-End Diffusion Model
EGNN + DDPM でポケット3D構造に条件付きR基生成(bioRxiv 2023 / J. Chem. Inf. Model. 2024, Xie & Yang et al.)
🎯 タンパク質ポケットの3D形状に適合したR基を、スキャフォールドを保ちながらend-to-endで生成する
① 背景と課題

リード最適化の中心的手法であるスキャフォールドデコレーションは、既存のコアを保ちながらR基を変更して薬理特性を改善する。しかし従来のSMILESベース法(LibINVENT等)は3D構造情報を無視し、EGNN自己回帰法(Pocket2Mol・FLAG)はエラー蓄積によりスキャフォールド保持が不安定。

LibINVENTは2D SMILES表現のみでポケット形状を考慮しない(Vina score最低)
Pocket2Mol/FLAGは自己回帰atom生成でエラー蓄積 → Recovery 4%/0%と不安定

→ 拡散モデルで全原子を同時生成し、スキャフォールド保持と3D構造意識を両立

② DiffDecアーキテクチャ
ポケット + スキャフォールド(コンテキストc, 固定)

フェイクアトム付きR基をz_T(ガウスノイズ)に初期化

EGNN(6層 EGCL, 128-dim, 4Å カットオフ)で逆拡散

T=1000 ステップでε_t を予測しノイズ除去

フェイクアトム除去 → RDKit分子として確定
② フェイクアトム機構

R基サイズ(最大10原子)の予測を別モジュールなしにend-to-endで実現する革新的機構。

従来アプローチDiffDecアプローチ
サイズ予測モジュール別途必要フェイクアトムで10にパディング
2段階生成(サイズ→構造)逆拡散で自然にサイズ確定
モジュール間誤差伝播リスクend-to-endで誤差なし
③ 性能サマリー
  • Single recovery 69.67%(LibINVENT比 1.87倍)
  • Multi recovery 45.34%(LibINVENT比 1.69倍)
  • Validity 98%・Vina -8.25 kcal/mol が全指標最良
  • アンカー自動決定でも Recovery 60.67%を維持
④ Single R-group 比較
手法Validity(%)Recovery(%)Vina(kcal/mol)
LibINVENT87.3537.33-8.10
Pocket2Mol51.144.00-8.11
FLAG87.950.00-7.62
DiffDec98.0069.67-8.25
④ Multi R-groups 比較
手法Validity(%)Recovery(%)Vina(kcal/mol)
LibINVENT8.6226.85-7.83
Pocket2Mol60.901.34-8.04
FLAG88.180.00-7.73
DiffDec97.1345.34-8.19
④ High Affinity達成率

参照リガンドより高いVina scoreを持つ生成分子の割合

55.06%
Single R-group(参照超え割合、次点 44.18%)
40.50%
Multi R-groups(参照超え割合)
④ 限界点
SA Score等の合成アクセシビリティ評価が不足
Uniqueness 48.54%と多様性の向上余地あり
R基サイズ上限10原子(大型R基未対応)
CrossDockedデータセット特化の汎化性が不明
⑤ テイクホームメッセージ
🧩 スキャフォールド保持を保証
コンテキスト固定の拡散設計により、Validity 98%でスキャフォールドを確実に保持しながらR基を生成。
🏗️ フェイクアトム = end-to-end革新
サイズ予測を別モジュールなしに内包し、単一の拡散過程でサイズ・構造を同時決定。
🎯 Recovery 2倍で既存法を圧倒
CrossDockedベンチマークでLibINVENT比約2倍のRecoveryを達成。3D構造認識の明確な優位性を示す。
🔓 アンカー不要で実用化可能
アンカー自動決定モードでも高性能を維持し、実際の創薬プロジェクトへの直接適用が可能。
ケムインフォマティクスへの応用
適用先ユースケース
lib/molgenMolgenYaml + DiffDec でポケット条件付きR基最適化ループ
lib/dockingUniDockRunner でDiffDec生成分子をバッチ評価・フィルタリング
lib/fep上位候補へMMGBSAEngineで相対ΔΔG評価

コード公開: github.com/biomed-AI/DiffDec

本研究のインパクト
  • 3D構造意識型スキャフォールドデコレーションのSOTA確立
  • 拡散モデルをリード最適化に適用した先駆的フレームワーク
  • UniDock + DiffDec 統合による自動リード最適化パイプライン構築の基盤