Bayesian最適化(Optuna TPE)で決定したハイパーパラメータ採用。大規模モデルの1/10以下の規模で同等性能。
sin/cos固定位置エンコーディング(追加パラメータなし)
| 指標 | VeGA | S4 | R4 | MolGPT | CharRNN |
|---|---|---|---|---|---|
| 有効率(%) | 96.57 | 98.40 | — | 99.40 | 97.50 |
| 新規性(%) | 93.60 | 88.10 | — | 79.70 | 84.20 |
| ユニーク@1k | 100.0 | 100.0 | — | 100.0 | 100.0 |
| FCD Test | 0.18 | 0.01 | — | 0.07 | 0.07 |
ChEMBL生成評価(スキャフォールド多様性):
| モデル | ユニークスキャフォールド数 | SDI |
|---|---|---|
| VeGA | 69,921 | 11.10 |
| S4 | 63,384 | — |
| R4 | 62,250 | — |
FXR(ファルネソイドX受容体)リガンド882化合物でfine-tuning後、新規候補分子を生成。GLIDEドッキング(PDB: 3DCT、SP精度)で結合ポテンシャルを検証。
既知リガンドのスキャフォールドを超えた新規化合物で結合ポテンシャルを確認