各オラクル評価(wet-lab assay・MD/FEPシミュレーション)が高コストなため、限られた予算内での「サンプル効率」が分子最適化の最重要課題。既存手法は長期メモリを持たず有用な知見が再利用されない。
→ 人間専門家のように「参考例を参照しながら経験から再利用可能な戦略を蓄積」するメモリ機構
ChEMBL 2.8M分子+物性値をFAISS+ECFP4でインデックス化した静的外部メモリ。最適化停滞時に現在分子のANN検索→Tanimoto類似度フィルタ→Top-K exemplarsを返す。
完全一致コピーにはペナルティ → パターン学習を促進
高報酬改善(Δr>δ)の遷移からedit cardを構築。GPT-4oが1文スキル("Replace methoxy with F on aromatic ring")に変換。停滞時にエージェントの作業メモリに注入。
| タスク | ベスト既存 | MolMem |
|---|---|---|
| QED+plogP | 18% | 58% |
| plogP+DRD2 | 低 | 大差 |
| DRD2+SA | 低 | 改善 |
| 全5多物性 | — | 大幅改善 |
GitHub: REAL-Lab-NU/MolMem 公開済み
| 機能 | Novice | Apprentice | MolMem |
|---|---|---|---|
| 外部DBの活用 | × | ○ | ○ |
| 成功経験の蓄積 | × | × | ○ |
| マルチターンRL | △ | × | ○ |
| 困難なターゲット | △ | × | ○ |