LLMは制約を自然言語で柔軟に指定して再学習なしに多様なタスクに対応できる点で、特定タスク最適化の従来モデル(VAE・拡散モデル・RL)と根本的に異なる。しかしLLMがどのような種類の創造性を示すかは未解明だった。
→ 「創造性」を2次元(収束×発散)で操作化し、制約満足と探索のトレードオフを統一指標で評価
収束的創造性(制約満足): Validity × Success Rate の幾何平均
発散的創造性(探索): Novelty × Uniqueness × Diversity の幾何平均
制約条件を追加するほど制約満足率が向上するという反直感的パターン。より具体的な指示がLLMを適切な化学空間に誘導する。
| サンプリング温度 | 収束的創造性 | 発散的創造性 |
|---|---|---|
| 低温(0.0〜0.3) | 安定・高い | 低い(多様性↓) |
| 中温(0.7) | 中程度 | 中程度 |
| 高温(1.0+) | やや低下 | 高い(多様性↑) |
制約満足への影響は限定的。多様性制御に有効
細粒度構造制約(特定官能基)はRDKit後処理でフィルタリングが効率的
| 指標 | 定義 |
|---|---|
| Validity | RDKit標準化適合率 |
| Success Rate | 全制約満足割合 |
| Novelty | ZINC250K比の新規性 |
| Uniqueness | バッチ内重複除外率 |
| Diversity | 平均Tanimoto距離 |
| Fully Creative % | Novel+Unique+Successを全同時満足 |