SpaceGFN: Programmable Chemical Space Exploration via GFlowNet

DOI: null (preprint, 2026) Category: machine_learning Authors: Zhu, Hsieh, et al.
ゴール:化学空間を「プログラム」として制約しつつ、GFlowNet で 多様性と高品質を両立する分子集合を生成し、合成可能性を確保する。

1背景と課題

分子最適化の主流は RL ベース(REINVENT, MolDQN)だが、最高スコアの分子に 集中し多様性が枯渇しがち。

従来の GFlowNet は化学空間を無制限に探索するため、 合成困難・特許衝突・物性逸脱な分子が大量に生成される。

必要なのは「制約付きで多様」を両立する枠組み。
キーワード:scaffold reaction template property range

2手法の概要

SpaceGFN=GFlowNet + プログラム可能な空間制約マスキング。

3本研究で示したこと

4主な結果(4パネル)

a多様性 × スコアのパレート

Internal Diversity Reward Score 0.5 0.7 0.9 0.4 0.7 1.0 SpaceGFN GFlowNet REINVENT

GuacaMol/MOSES:SpaceGFN が Pareto 最良。 高多様性(≥0.8)でも reward を保つ。

b合成アクセス性 (SAScore↓)

2.0 3.0 4.0 5.0 SAScore (lower=better) 4.6 REINVENT 4.1 GFlowNet 3.5 FBDD 2.7 SpaceGFN Δ = -1.9 (合成性 大幅向上)

合成経路制約下:SAScore 4.6 → 2.7。Enamine/WuXi 反応列挙への適合率が向上。

cアーキテクチャ:制約マスク統合

state s_t 部分分子 π_F(a|s) GFlowNet policy Constraint Mask scaffold ∧ rxn ∧ property action a (allowed) reward R(x) = dock·QED·SA·aff

状態 → policy → マスク済み action 集合からサンプル。違反フローは確率0。

d生成パイプライン(funnel)

化学空間(無制約) ~10^33 scaffold 制約後 ~10^9 reaction template 制約後 ~10^6 SpaceGFN 出力 ~10^3 (多様)

制約 DSL を重ねるほど空間が 10^33 → 10^3 に縮小。 最終層で多様性とスコアを両立。

5テイクホームメッセージ

制約 × 多様性:プログラム制約マスクと GFlowNet の組合せは、 REINVENT 系の モード崩壊 を構造的に回避する。

合成可能性が向上:SAScore 4.6 → 2.7(Δ -1.9)。 Enamine/WuXi 反応列挙への適合率が高い。

lib/molgen への移植MolgenYaml.space_constraints として scaffold / reaction / property を宣言し、 JobManager 経由で GFlowNet バックエンドへ渡す設計が自然。