従来の科学的LLM(Galactica・ChemBERTa・SciBERT等)は論文テキストから事前学習された「知識検索型」であり、実験結果からのリアルタイム推論は弱かった。限られた実験データ(n=10〜50)から次の最優先実験を推薦する能力が特に不足していた。
→ (実験条件 → 結果 → 次の実験デザイン)のトリプレット形式で実験者の動的推論を学習
2.3M件の実験記録(化学・生物学・材料科学)を標準化し、Llama 3.1 / Mistral-7BベースのLLMをファインチューニング。
DESROの「次実験推薦」はBayesian最適化・Active Learningと同じ問題設定だが、実験記録の文脈的連鎖をLLMが統合的に解釈する点が根本的に異なる。
| 手法 | 文脈統合 | 少量データ |
|---|---|---|
| Bayesian最適化 | △(定量モデル) | △ |
| Active Learning | △(不確実性) | △ |
| DESRO | ◎(LLM推論) | ◎ n=10〜50 |
特に限られた実験データ(n=10〜50)での推薦タスクでベイズ最適化を大幅に上回った
各記録: (実験条件→観測結果→次実験デザイン)のトリプレット形式で標準化
| タスク | ドメイン |
|---|---|
| 有機合成の最適条件探索 | 化学 |
| タンパク質変異の効果予測 | 生物学 |
| 新材料組成探索 | 材料科学 |
| 次の最優先実験推薦(n=10〜50) | 全ドメイン |