SpaceGFN: Programmable Chemical Space Exploration via GFlowNet

1背景と課題

分子最適化の主流は RL ベース（REINVENT, MolDQN）だが、最高スコアの分子に集中し多様性が枯渇しがち。

従来の GFlowNet は化学空間を無制限に探索するため、 合成困難・特許衝突・物性逸脱な分子が大量に生成される。

必要なのは「制約付きで多様」を両立する枠組み。
キーワード：scaffold reaction template property range

SpaceGFN＝GFlowNet ＋プログラム可能な空間制約マスキング。

GuacaMol/MOSES：SpaceGFN が Pareto 最良。高多様性（≥0.8）でも reward を保つ。

合成経路制約下：SAScore 4.6 → 2.7。Enamine/WuXi 反応列挙への適合率が向上。

状態 → policy → マスク済み action 集合からサンプル。違反フローは確率0。

制約 DSL を重ねるほど空間が 10^33 → 10^3 に縮小。最終層で多様性とスコアを両立。

制約 × 多様性：プログラム制約マスクと GFlowNet の組合せは、 REINVENT 系の モード崩壊 を構造的に回避する。

合成可能性が向上：SAScore 4.6 → 2.7（Δ -1.9）。 Enamine/WuXi 反応列挙への適合率が高い。

lib/molgen への移植：MolgenYaml.space_constraints として scaffold / reaction / property を宣言し、 JobManager 経由で GFlowNet バックエンドへ渡す設計が自然。