MAPCliff-WMGR: Activity Cliff-Aware Molecular Activity Prediction
重みつき分子グラフ × IFM で活性崖問題を解決(J. Chem. Inf. Model. 2025, 65, 12978−12989 · Chen & Lyu et al.)
🎯 類似構造・異なる活性を持つ「活性崖分子」の予測精度を根本的に改善し、バーチャルスクリーニングの信頼性を高める
① 課題:活性崖(Activity Cliff)問題

Tanimoto類似度 > 0.9 の分子ペアが 100倍以上の活性差を示す「活性崖」は、創薬における最大のSAR予測困難要因のひとつ。既存GNNは類似分子を埋め込み空間で近傍に配置するよう学習するため、構造的に崖問題への対処が困難。

標準GNN(AFP/GROVER/GEM)は活性崖分子で性能が急落—van Tilborg 2022でSVM+ECFPが深層学習を凌駕
深層モデルのスペクトラルバイアス:低周波パターンを選好 → 崖特有の急峻な活性変化を学習できない

→ MAPCliff-WMGRは「グラフ表現力の強化」と「高周波成分の学習」という2軸で問題を解決

② コア1:mGraphSNNGAT

重複部分グラフ係数で隣接行列を強化し1-WLテスト超の識別力を実現

SMILES

Structure Converter
(ω(v,u) = |E_vu|/(|V_vu|-1)^λ を隣接行列に付加)

NodeEdgeFeatureFusion
(辺特徴を注意機構でノードへ統合)

適応的自己ループ重み + 層ごとの特徴集約

分子埋め込みベクトル

+ PaDEL-Descriptor記述子 / PubChem FP / ECFP4(1024bit) を結合

③ コア2:IFM モジュール

スペクトラルバイアスを克服する独立特徴マッピング

IFM(x) = [sin(c⊙x), cos(c⊙x)]
c ~ N(0, σ²) : 学習可能パラメータ

各特徴次元に独立して正弦・余弦変換を適用することで、活性崖特有の高周波パターンを効率的に学習。内積がチューナブルカーネルに対応。

→ 最終MLP前に配置: GNN埋め込み → IFM → MLP → 予測値

④ 結果(a) MoleculeACE (30データセット)
モデル崖分子RMSE
SVM + ECFP0.728
AFP (GAT)0.742
GROVER0.751
KPGT0.729
MAPCliff-WMGR0.677 (▼7.2%)
④ 結果(b) MACE-R7 ベンチマーク(新規)

IC50・Ki・EC50・Kd・AC50・pIC50・pKi の7応答タイプ × 複数標的

+8.7%
崖分子での平均改善(全ベースライン比)
+3.2%
全分子での平均改善

多様な応答タイプ・標的でのロバスト性を確認

④ 結果(c) ERα ケーススタディ

乳がん治療薬(低分子ERα標的)の活性崖分子に適用

  • 注意機構により活性崖を引き起こす重要原子を可視化
  • 次元削減で崖分子クラスターを識別
  • 微小構造変化がどの程度活性変化に寄与するかを定量評価

解釈性が実用的なSAR探索ガイドとして機能

⑤ 限界点
重複部分グラフ計算コスト → 大規模VSには前フィルタが必要
IFMのσハイパーパラメータ最適化指針が未確立
活性崖定義(MMP-cliff閾値)依存性の議論が不十分
コード・実装の公開なし(再現性に課題)
⑥ テイクホームメッセージ
🧬 1-WL超の識別力
重複部分グラフ係数で隣接行列を強化し、構造的に類似した活性崖分子を識別可能にした初のGAT亜種。
🎵 高周波学習の実現
IFMの正弦波変換でスペクトラルバイアスを克服—崖のような急峻な活性変化を深層モデルで学習可能に。
📊 MACE-R7新ベンチマーク
7応答タイプ×多ターゲットの包括的活性崖評価基盤を新規構築。今後の比較研究の標準になりうる。
🔍 解釈性付き予測
注意スコアで崖寄与原子を可視化—予測だけでなくSAR理解ツールとしても機能。
ケムインフォマティクスへの応用
適用先ユースケース
lib/dockingUniDock後段スコアラー: 崖リスク分子ペアのフラグ付け
lib/dockingMMGBSAEngine特徴変換器としてIFMを転用
lib/molgenMolgenYaml崖ペナルティスコアラーとして統合

Tanimoto > 0.7 かつ予測活性差大のペアを自動で実験優先リストへ追加