条件付き分子生成では化学的有効性・プロパティ制御・構造多様性・サンプリング効率の4目標を同時に達成する必要がある。画像生成で成功したCFG・AG・MG等のガイダンス手法は3D分子生成に直接適用できない。原因は分子が連続変数(原子座標)と離散変数(原子タイプ・結合次数・電荷)を持ち、それぞれに異なるガイダンス定式化が必要なためである。
→ 3D分子の連続+離散ハイブリッドガイダンス戦略を初めて体系的に研究
| 手法 | 原理 | 推論コスト |
|---|---|---|
| CFG | 条件付き/無条件モデル補間 | 2パス |
| AG(推奨) | 劣化モデルでガイド | 2パス(小型) |
| MG | ガイド信号を訓練に組込 | 1パス |
理論的優雅さより数値安定性が実用上重要
逆説的発見:
| 手法 | プロパティ↑ | 有効性↑ | 多様性↑ | 速度↑ |
|---|---|---|---|---|
| Vanilla | baseline | high | high | fastest |
| CFG | ★★★★ | ★★★ | ★★ | ★★ |
| AG | ★★★ | ★★★★ | ★★★ | ★★★ |
| MG | ★★ | ★★★ | ★★★ | ★★★★ |
CFGが最高精度、AGが最バランス。QMe14S(14元素)にも同傾向で転移可能。
ガイダンススケール(w1: 1.0–3.0, w2: 1.0–3.0)はプロパティ・モデル・データセットで最適値が異なる。Bayesian最適化(50 trial)で自動決定:
| 適用先 | ユースケース |
|---|---|
| lib/molgen | MolgenYamlのスコアラーをCFG/AG条件に統合。目標QED・LogP・SAへの条件付き生成 |
| lib/molgen | Bayesian最適化でプロパティ別のw1,w2を自動チューニング |
| lib/docking | Vina scoreをリアルタイムガイダンスとして利用するguided generation |