創薬の小分子最適化は、活性・溶解性・選択性・ADMET・合成容易性が相互依存する多目的問題である。従来の生成モデル(REINVENT 4 など)は、複数目的を 固定重みのスカラー合成スコア に圧縮して RL で最適化するため、トレードオフが暗黙の重み設定に閉じ込められてしまう。
→ Pareto 支配を一級概念として扱い、最適化圧力を学習進行に応じて自動再調整できる多目的 RL を構築したい。
REINVENT 4 と 同一目的関数セット(活性 + 溶解性 + 薬物様性 + SA Score)で比較。
| 指標 | REINVENT 4 | AI-MedCraft |
|---|---|---|
| パレートフロント幅 | 狭い(局所) | 広い(多様) |
| 活性–溶解性中間解 | 少 | 多 |
| 計算コスト | 基準 | 同等 |
| 重み手動調整 | 必須 | 不要 |
→ 同じ予算で活性を保ちつつ溶解性を改善する中間解集団を多数獲得。
→ 各軸への圧力は学習中に集団の収束度から自動再配分される。