活性クリフ(Activity Cliff)とはTanimoto類似度が高い(≥0.85)のにpIC50が大きく異なる化合物ペア。従来MLはSAR景観を平滑化する傾向があり、このクリフ領域で大きく外れる。
→ SALI指標でクリフを定量化し、MLをAC-awarに設計・評価・生成の3層で再構築する
SALI(i,j) = |A_i − A_j| / (1 − sim(i,j))
Tanimoto類似度 sim が高く活性差が大きいほどSALI高 → クリフペアと判定
RMSEcliff: クリフペアのみのRMSE。全体RMSEより厳しく、クリフ領域の弱点を可視化。
SALI-based retrieval: クリフ構造の早期認識能力スコア。
ACNet score: クリフネットワーク(クリフグラフ)の再現性。
| 層 | 手法 | 改善点 |
|---|---|---|
| Layer 1 (表現) | コントラスト学習 | クリフペアembedding分離 |
| Layer 2 (評価) | RMSEcliff | MLの盲点を可視化 |
| Layer 3 (生成) | AC-aware de novo | SAR不連続空間探索 |
| 観点 | 従来MLモデル | AC-aware |
|---|---|---|
| 評価指標 | 全体RMSE | RMSEcliff追加 |
| クリフ認識 | ✗(平滑化) | ✓ |
| 分子表現 | 汎用FP | コントラスト学習 |
| de novo生成 | 活性最大化のみ | AC対を意図的生成 |