構造ベース医薬品設計(SBDD)における分子生成は、自己回帰型(Pocket2Mol, ResGen, FLAG)と一発生成の拡散モデル(TargetDiff, DecompDiff, MolCRAFT)の二つのパラダイムに大別される。前者は誤り蓄積、後者は剛体リガンド前提という根本的限界を抱える。
いずれも静的なリガンドモデリングに支配されている一方、実際のタンパク質-リガンド相互作用は本質的に動的であり、結合過程ではコンフォメーション調整が不可欠である。さらに既存手法は高親和性のみを最適化し、複数物性(QED/SA/LogP/TPSA/HBA/HBD/Fsp3/ROTB)の同時制御が困難で、生成分子は学習セットの品質上限を超えられない。
Stage1で物性条件付け+ポケット特化を獲得した参照Denoiserを固定し、Stage2でポリシーDenoiserをRL更新。各DenoisingステップをMDPのstateとして親和性報酬を最適化、KL制約で過度な逸脱を抑制する。
CrossDocked2020テストセットの各タンパク質ポケットに対し100分子を生成。Pocket2Mol・FLAG・TargetDiff・MolCRAFT等のSOTAベースラインと、Vina Score / Vina Min / Vina Dock の3指標、成功率、QED、SA、多様性で比較した。
参照分子の親和性を上回ったのはSeFMolが唯一。さらに学習データ外の実世界の未見ターゲットでも、水素結合・疎水性接触などカノニカルな相互作用パターンを保ったまま新規ケモタイプを生成できることを確認した。
| 適用先 | ユースケース | 期待効果 |
|---|---|---|
| lib/docking | UniDockRunner と統合し、ポケット形状から直接de novo候補を生成。ProLIFCalculator で計算した相互作用フィンガープリントスコアをRL報酬に注入 | VS非カバー領域の探索 |
| lib/molgen | MolgenYaml が SeFMol を de novo 設計エンジンとして呼び出し、8物性目標値を指定 → MMGBSAEngine/DockFEP に接続 | ターゲット特化de novoループ |