1背景と課題
分子最適化の主流は RL ベース(REINVENT, MolDQN)だが、最高スコアの分子に
集中し多様性が枯渇しがち。
従来の GFlowNet は化学空間を無制限に探索するため、
合成困難・特許衝突・物性逸脱な分子が大量に生成される。
必要なのは「制約付きで多様」を両立する枠組み。
キーワード:scaffold
reaction template
property range
2手法の概要
SpaceGFN=GFlowNet + プログラム可能な空間制約マスキング。
- 制約 DSL:scaffold / reaction / property の3層
- 状態遷移グラフに 制約マスク を挿入し、違反フローを禁止
- 多目的 reward:dock score × QED × SAScore × affinity
- 訓練:flow-matching objective(PPO 変形)
- サンプリング:報酬比例 → 多様な高スコア分子集合
3本研究で示したこと
- 化学空間制約を プログラム的に記述 する DSL を提案
- GFlowNet の状態遷移にマスキングを統合し、制約違反ゼロ を保証
- GuacaMol / MOSES / カスタム最適化で
多様性 × スコアのパレート最良
- 合成経路制約下で SAScore が REINVENT より有意に向上
- 多目的 reward の合成(dock + QED + SA + affinity)が安定収束
4主な結果(4パネル)
a多様性 × スコアのパレート
GuacaMol/MOSES:SpaceGFN が Pareto 最良。
高多様性(≥0.8)でも reward を保つ。
b合成アクセス性 (SAScore↓)
合成経路制約下:SAScore 4.6 → 2.7。Enamine/WuXi 反応列挙への適合率が向上。
cアーキテクチャ:制約マスク統合
状態 → policy → マスク済み action 集合からサンプル。違反フローは確率0。
d生成パイプライン(funnel)
制約 DSL を重ねるほど空間が 10^33 → 10^3 に縮小。
最終層で多様性とスコアを両立。
5テイクホームメッセージ
制約 × 多様性:プログラム制約マスクと GFlowNet の組合せは、
REINVENT 系の モード崩壊 を構造的に回避する。
合成可能性が向上:SAScore 4.6 → 2.7(Δ -1.9)。
Enamine/WuXi 反応列挙への適合率が高い。
lib/molgen への移植:MolgenYaml.space_constraints
として scaffold / reaction / property を宣言し、
JobManager 経由で GFlowNet バックエンドへ渡す設計が自然。