Enamine REALのような100億規模の仮想化学空間は、全化合物のドッキングが非現実的(コストが空間サイズに線形比例)。Deep生成モデルは空間を直接サンプリングできるが、合成可能性の保証が困難。特に目標最適化時に合成可能性が損なわれることが知られていた(Gao & Coley)。
→ PoE CLM: 空間priorを学習して合成可能性を担保 + α係数で多目的制御
expertとanti-expertの共有バイアスが相殺 → 化学空間逸脱リスク低減
| モデル | DRD2+(all) | DRD2+(in)↑ |
|---|---|---|
| prior (85M) | 1.42% | 1.08% |
| expert only | 45.1% | 1.03% |
| PoE α=1.0 | 8.62% | 4.83% |
| PoE α=2.0 | 19.7% | 7.69% |
| PoE α=2.5 | 25.2% | 7.38% |
expert単独では空間内率=1.03%と壊滅的。PoE α=2.0が最良バランス。
| 条件 | 三条件同時満足(in) |
|---|---|
| prior only | 0.07% |
| PoE DRD2のみ | 0.55% |
| PoE +QED | 0.96% |
| PoE +BBB | 0.74% |
| PoE DRD2+QED+BBB | 1.88% |
三条件(DRD2+・QED+・BBB+)を同時に満たす空間内化合物が最大1.88%。