ケミカル言語トランスフォーマー(CLM)は SMILES 系列をエンコード・デコードして潜在空間を学習し、目標特性(CMC, logP など)を持つ分子を逆設計する。実装は単純で表現力も高い一方、デコーダが「目標潜在ベクトル」から外れた分子を吐く systematic なバイアスが知られており、生成物の有効率や特性誤差の安定性が損なわれてきた。
→ 「デコーダが安定動作する潜在領域」を可視化・定量化し、その内側で逆設計を完結させたい。
| CMC 設計則 | 本手法 生成分子 |
|---|---|
| アルキル鎖長 (C8〜C16) | 分布が経験則範囲内 |
| headgroup 種類 | イオン性 / 非イオン性が物理整合 |
| logCMC 相対誤差 | ~1% (目標値帯内) |
| 有効 SMILES 率 | ~90% |
| 多様性(化学空間) | GA 並みを維持 |
round_trip_fidelity スコアラを追加