MolAIのEuclidean距離はTanimotoが見落とすプロトネーション状態・物理化学的差異を捉える。
| 課題 | Tanimoto (Morgan) | MolAI Euclidean |
|---|---|---|
| 上位1000件中同一スコア化合物数 | 704件(区別不可) | 0件(全て一意) |
| プロトネーション異性体(同一分子) | 0.52(同一) | 3.01 vs 3.94(区別) |
| 類似分子ランキング | 4位→11位にズレ多発 | 物理化学的に直感的な順序 |
| テストセット | Accuracy | ROC-AUC |
|---|---|---|
| Enamine (10K) | 0.987 | 0.99 |
| ZINC22 (10K) | 0.891 | 0.98 |
| iGen-1/2/3 | 0.843-0.851 | 0.97 |
ドッキング前処理に組み込んで偽陽性削減に直接貢献
| モデル | gefitinib超活性率(%) |
|---|---|
| MolAI | 22.4% |
| NP-VAE | 15.2% |
| REINVENT 3.0 | 6.8% |
3650分子生成→817分子がgefitinib超え。キナゾリンモチーフを保持し新規相互作用(Asn842, Thr854等)を獲得。