Apo2Mol: 3D Molecule Generation via Dynamic Pocket-Aware Diffusion Models
apoタンパク質構造(非結合状態)からリガンド+ホロポケットを同時拡散生成(arXiv:2511.14559, Zheng & Li et al., 2025)
🎯 holo不要。apo入力でVina min avg -7.86(holo入力SOTAのIPDiff -7.09を超える)。PLINDER24,601件大規模データセット構築
① 解決する根本課題:apo問題

実世界の創薬ではholoタンパク質構造(リガンド結合状態)が利用できないケースが多い。既存SBDD(TargetDiff・IPDiff・DiffSBDD等)は全てholo構造を前提とする設計のため、次のシナリオに対応できない:

新興ターゲット: 未解明の結合状態(apo構造しかPDBにない)
誘導適合(induced fit): ポケット形状はリガンドによって変化 → apoポケットにholo用モデルを適用は不適切
AlphaFold構造: AF3が予測するのはapo様構造が多い

→ apoを入力としてリガンドと誘導適合後のホロポケットを同時生成

② アーキテクチャ概要
apoポケット構造 (apo protein coords + features)
↓ SE(3)-等変階層グラフ拡散モデル
↓ 全原子メッセージパッシング(複合グラフ)
↓ リガンド: 原子座標(MSE) + 原子タイプ(KL)
↓ ポケット: SAGPooling → 残基レベル
↓ Translation(MSE) + Quaternion(L1) + Chi角(cosine)
↓ 生成リガンド + ホロポケット
③ 5成分損失関数
L = λ1·LM_x (リガンド座標 MSE)
+ λ2·LM_v (原子タイプ KL)
+ λ3·LP_tr (translation MSE)
+ λ4·LP_q (rotation L1 + norm正則化)
+ λ5·LP_X (chi角 cosine損失)

Quaternion使用 → rotation vectorより
Vina min +0.28 kcal/mol改善
④ 主要結果比較
Method (入力)Vina min avg↓Vina min med↓QED↑HA%↑
TargetDiff (apo)-4.80.48
IPDiff (apo)-6.5
IPDiff (holo)-7.09-7.080.5444.9%
Apo2Mol (apo)-7.86-8.030.58752.9%

Apo2Mol(apo入力) > IPDiff(holo入力) — 理想的なholo条件を超える

⑤ データセット構築

PLINDER由来 apo-holo-ligand トリプレット

24,601件
100%配列同一性 / 解像度≤2.5Å / 薬物様リガンドのみ
  • ポケット定義: リガンド10Å以内の残基
  • 時系列分割: 23,052 / 1,071 / 478
  • イオン・補因子・断片を除外した高品質データ
⑥ 構造品質評価
指標TargetDiffIPDiffApo2Mol
C-C結合JSD↓0.2730.2160.178
QED avg↑0.480.540.587
ポケットRMSD分布 JSD=0.317 → 完全なholo再現には限界
⑦ アブレーション
条件Vina min avgQED avg
Apo2Mol (full)-6.790.587
w/o complex graph-6.18 (-0.61)0.524
w/o quaternion-6.51 (-0.28)0.523

multi-edge設計とquaternion表現が両方重要

⑧ テイクホームメッセージ
🔓 apo入力でholo入力SOTAを超える
apoのみ利用可能な創薬ターゲットへの対応を可能にしながら、holo入力ベースラインの最高性能(IPDiff)を凌駕。
🔬 リガンド+ポケット同時生成
リガンド原子座標・タイプ + ポケット残基の平行移動・回転・chi角を統一損失関数で同時最適化。誘導適合を内在的にモデル化。
📊 PLINDER 24,601件の大規模データセット
100%配列同一性・高分解能でフィルタした時系列分割データセット。apo-holo遷移研究の基準データセットとなりうる。
🔗 コード公開(GitHub)
github.com/AIDD-LiLab/Apo2Mol で実装公開。AlphaFold apo構造との組み合わせでlib/molgenに即統合可能。
ケムインフォマティクスへの応用
適用先ユースケース
lib/molgenAlphaFold apo構造→リガンド生成パイプライン(JobManager統合)
lib/mdApo2Mol予測ポケット変化をMDトラジェクトリと比較検証(RMSDAnalyzer)
lib/fepapoのみ利用可能ターゲットへのMMGBSA計算(holo予測を出発点に)
本研究のインパクト
  • apo→holo遷移を内在的にモデル化した初の大規模SBDDフレームワーク
  • 探索可能なターゲット空間を「holo既知」から「apo利用可能」に拡大
  • PLINDER由来24,601件データセットがapo-holo研究コミュニティに貢献