From Obstacle to Design Advantage: Activity Cliff Aware Modeling for Small-Molecule Drug Discovery
Szostek, Szulczyk (Warsaw Medical University) | Drug Discovery Today, 2025 | DOI: 10.1016/j.drudis.2025.104589
🎯 活性クリフ(構造類似・活性大差ペア)をMLの「障害」から「設計上の優位性」に転換する三層フレームワーク(AC-aware表現・評価・生成)を提案する。
① 背景と課題

活性クリフ(Activity Cliff)とはTanimoto類似度が高い(≥0.85)のにpIC50が大きく異なる化合物ペア。従来MLはSAR景観を平滑化する傾向があり、このクリフ領域で大きく外れる。

MoleculeNet等の標準ベンチマークは平均RMSEで評価——クリフ領域の弱点が隠れる
コントラスト学習の恩恵がACクリフ特化か全体性能かのトレードオフが未評価

→ SALI指標でクリフを定量化し、MLをAC-awarに設計・評価・生成の3層で再構築する

② 手法: SALI & 三層フレームワーク

SALI(i,j) = |A_i − A_j| / (1 − sim(i,j))

Tanimoto類似度 sim が高く活性差が大きいほどSALI高 → クリフペアと判定

AC-aware 三層フレームワーク Layer 1 AC-aware表現 Layer 2 クリフ評価指標 Layer 3 AC-aware生成 コントラスト学習 RMSEcliff / ACNet de novo クリフ生成 MoleculeACE パッケージで実装可能
② 手法: 専用評価指標

RMSEcliff: クリフペアのみのRMSE。全体RMSEより厳しく、クリフ領域の弱点を可視化。

SALI-based retrieval: クリフ構造の早期認識能力スコア。

ACNet score: クリフネットワーク(クリフグラフ)の再現性。

MoleculeACE
AC解析フレームワーク (github.com/molML/MoleculeACE)
③ 本研究で示したこと(要点)
  • 活性クリフを「設計上の優位性」として再定義——SAR不連続点を系統的に探索できる
  • RMSEcliffが全体RMSEと乖離するMLモデルの盲点を定量化
  • コントラスト学習でAC感受的な分子表現を実現
  • MoleculeACEによる標準AC評価プロトコルの確立を提唱
④ 主な結果 (a) 全体RMSE vs RMSEcliff
全体RMSE vs RMSEcliff(概念図) 良いMLモデル 悪いMLモデル 全体RMSE+RMSEcliff共に低 RMSEcliffのみ高(盲点) RMSE値 全体RMSE RMSEcliff
④ 主な結果 (b) SALI の概念
SALI スコア高 = 活性クリフペア A₁ pIC50=7.2 A₂ pIC50=7.0 SALI 低(非クリフ) B₁ pIC50=9.5 B₂ pIC50=5.0 SALI 高 ← クリフ!
④ 主な結果 (c) 三層アプローチの効果
手法改善点
Layer 1 (表現)コントラスト学習クリフペアembedding分離
Layer 2 (評価)RMSEcliffMLの盲点を可視化
Layer 3 (生成)AC-aware de novoSAR不連続空間探索
④ 主な結果 (d) lib への実装方針
lib/docking
QSARスコアリングにRMSEcliff評価を追加——クリフ領域の予測外れを検出
lib/molgen
SALIスコア高ペアを意図的に生成するObjectiveをMolgenYamlに追加
MoleculeACE
既存SARデータセットのクリフ解析に即座に利用可能なOSS
⑤ テイクホームメッセージ
RMSEcliffで「MLの見えない弱点」を可視化
全体RMSEが低くてもRMSEcliffが高いモデルはクリフ近傍で使えない——評価指標を変えるだけで発見できる
活性クリフはSAR地図の「断層」
クリフの両側を意図的にサンプリングすることで最も情報豊かな構造変換を発見できる
lib/docking QSARにRMSEcliff統合
MMGBSAEngineの予測精度評価にクリフ特化指標を加えることでスクリーニング信頼性を向上できる
MoleculeACEはすぐ使える
既存SARデータのクリフ解析にMoleculeACEを活用し、lib/molgenのSAR探索効率化に直結できる
従来手法 vs AC-aware
観点従来MLモデルAC-aware
評価指標全体RMSERMSEcliff追加
クリフ認識✗(平滑化)
分子表現汎用FPコントラスト学習
de novo生成活性最大化のみAC対を意図的生成
本研究のインパクト
  • QSARモデル評価にRMSEcliffを追加するだけでlib/dockingのスクリーニング精度評価が改善
  • lib/molgenのMolgenYamlにSALI最大化Objectiveを追加することでSAR断層面の系統的探索が可能
  • MoleculeACEをlib/dockingのQSAR評価ユーティリティとして統合することを推奨