創薬における化学空間は推定 1060 規模と巨大であり、特に CNS(中枢神経)薬物では BBB 透過・神経毒性・複数物性の同時最適化が必須となるため、ヒューリスティック設計だけでは到達可能なケモタイプが限定される。深層生成モデル(VAE/GAN/RNN/Transformer/拡散/NF)は条件付き生成・潜在空間操作・強化学習との組合せにより de novo 分子設計を加速してきたが、アーキテクチャごとに失敗モード(mode collapse、訓練不安定性、scaffold バイアス)が異なる。
本レビューは「分子表現 × モデルアーキテクチャ × 評価指標」の 3 軸で 7 種の生成モデルを体系化し、CNS 創薬という応用ドメインに焦点を当てて現状と課題を整理する。
SMILES または分子グラフを入力に 7 種アーキテクチャを横並びで比較し、CNS MPO・BBB+ 確率・毒性フィルタをオラクルとした条件付き生成へ統合する枠組み。
RNN+RL (0.91) と Hybrid (0.93) が GuacaMol 目標指向タスクで最良。拡散モデル(0.84) は 3D 品質で別軸の SOTA。
GuacaMol(20 タスク・目標指向生成)と MOSES(distribution learning)が de facto 標準。RNN+RL 系の REINVENT は MPO タスクで 0.91 前後を達成し、拡散モデルは 3D 構造品質(PoseBusters 等)で SOTA を継続的に更新する。
REINVENT4 / GuacaMol / MOSES のリファレンス実装は GitHub に公開され、CNS MPO スコアラーは RDKit ベースで再実装可能。
6 軸(MW, logP, HBD, TPSA, pKa, Pgp)合算スコア ≥ 4.0 が CNS 候補の目安。各軸の desirability は monotonic scoring で算出。
| 適用先 | ユースケース |
|---|---|
| lib/molgen | MolgenYaml に 7 アーキテクチャ選択肢と REINVENT4 ラッパを実装。CNS MPO・BBB+ をスコアラー登録し MPO 生成を実現。 |
| lib/docking | 生成分子に対する Pgp 非基質性・BBB+ 予測スコアを ProLIF/UniDock 後段の MPO フィルタとして統合。 |
| lib/molgen | 毒性予測モデル (hERG, hepatotoxicity) を多目的オラクルに追加し scaffold 多様性を penalize して新規ケモタイプ探索を促進。 |