In-Pocket 3D Graphs Enhance Ligand-Target Generative Small-Molecule Creation: A Dopamine D2 Receptor Model System
J. Phys. Chem. B | 2026 | DOI: 10.1021/acs.jpcb.5c05350
ポケット内3Dリレーショナルグラフ+cVAEでD2R特異的なリガンドを生成。2D条件付け手法よりドッキングスコアと接触パターンの整合性で優位。
背景と課題

SBDD(Structure-Based Drug Design)型の生成モデルは増えているが、ポケット情報の与え方は依然として粗い表現に留まっている。多くは結合ポケットを scalar/vector の集約特徴量に潰すか、リガンドとタンパク残基の関係を 2D グラフに圧縮していた。結果として、ポケット形状や残基側鎖の幾何配置が生成分子に十分反映されず、ドッキングしてみると残基との実接触がずれる、というギャップが生じていた。

限界 1:ポケット記述子を scalar/vector に圧縮 → 残基ごとの幾何関係が落ちる
限界 2:拡散モデル系(TargetDiff, DiffSBDD)はサンプリングが重く反復探索に不向き

→ 本研究の動機:ポケット内のリガンド原子と残基原子の 3D 接触を「リレーショナルグラフ」として直接条件にした、軽量な cVAE で SBDD 生成を再構築する。

手法の概要:In-Pocket 3D Relational Graph + cVAE
  • D2R 結晶構造から距離カットオフ ≤ 4.5 A でリガンド原子と残基原子の接触をヘテログラフ化
  • ノード特徴:原子種・部分電荷・疎水性
  • エッジ特徴:原子間距離・相互作用タイプ(HBD/HBA・疎水・π-π)
  • GNN エンコーダ → 潜在 z → E(3)-equivariant デコーダで 3D 座標と元素を自己回帰生成
  • RDKit + ETKDG → Glide / Vina ドッキングで品質評価
D2R pocket PDB <=4.5A Hetero Graph node:atom/q edge:dist/type GNN enc → z (latent) E(3)-equiv decoder 3D coords + element 出力 3D 分子 → ETKDG → Glide / Vina で評価
本研究で示したこと
  • D2R ポケットに対し validity / uniqueness / novelty を保ちつつ生成可能
  • 2D SMILES 条件付け(REINVENT 系)よりドッキングスコアが有意に高い
  • 生成分子と残基の HBD/HBA・疎水・π-π 接触頻度が既知活性リガンド分布に近い(ProLIF 解析)
  • VAE 系のため拡散モデル比でサンプリングが軽量
  • ポケット形状を 3D グラフのまま条件にする SBDD 生成のひな型を提示
(a) ドッキングスコア分布の比較
Glide / Vina docking score 分布(kcal/mol、低いほど良) ← 低い = 強い結合 -12 -9 -6 -3 2D cond. REINVENT median ≈ -7.4 3D-Graph cVAE (本研究) median ≈ -9.1 既知活性 D2R ligands median ≈ -9.7

3D-Graph cVAE の中央値は 2D 条件付けより約 -1.7 kcal/mol 改善し、既知 D2R 活性体に近い帯に分布。

(b) ポケット残基との接触頻度
D2R 主要残基への ProLIF 接触頻度(%) 100 75 50 25 D114 V115 S193 S197 F389/390 既知活性 3D-Graph cVAE 2D 条件付け

塩橋アンカー(D114)と TM5 セリン群(S193/S197)への接触で既知活性体プロファイルを再現。

(c) 相互作用タイプの構成比
生成分子と D2R の相互作用タイプ内訳(%) 既知活性 HBD 20 HBA 18 疎水 36 π-π 26 3D-Graph 19 19 33 29 2D 条件 12 12 52 24 0% 100% HBD HBA 疎水 π-π ※相互作用カウントの構成比

2D 条件付けは疎水偏重で π-π / HBD が不足。3D-Graph 生成は既知活性体の構成バランスに最も近い。

(d) 分子品質メトリクス(実数表)
指標2D 条件 REINVENT3D-Graph cVAE既知活性
Validity0.970.94
Uniqueness0.920.96
Novelty0.810.88
QED 平均0.580.620.65
Glide score 中央値 (kcal/mol)-7.4-9.1-9.7
D114 接触率 (%)5094100
π-π 接触割合 (%)242926

Glide / D114 接触率 / π-π バランスで 3D-Graph cVAE が 2D ベースラインを上回り、既知活性プロファイルに最も近接。Validity だけはわずかに譲るがトレードオフ範囲。

SA score など合成可能性の系統評価は未実施 — 今後の検証ポイント。
テイクホームメッセージ
ポケットを 3D グラフで条件にする価値
残基ごとの幾何関係をエッジ属性に残したまま生成器に渡すことで、ドッキング後の接触整合性が 2D 条件付けより明確に向上した。
VAE で十分戦える
拡散モデルを使わずとも E(3)-equivariant デコーダ付き cVAE で SBDD 生成は機能し、サンプリングが軽量という現実的優位を持つ。
D2R 単一ターゲット由来の汎化リスク
訓練が D2R 既知リガンド集合に依存しており、別 GPCR / 酵素ポケットへの転移は未検証。族横断ベンチマークが次の宿題。
合成可能性の評価不足
3D 座標の妥当性は確認されたが SA score / Retro 評価は未着手。実合成 → assay まで貫通させて初めて SBDD としての完成度が測れる。
応用補足:ケムインフォ・パイプラインへの組み込み
  • lib/molgen:MolgenYaml に in-pocket 3D-graph cVAE をバックエンド追加し、任意ポケット PDB を入力にできる
  • lib/docking:生成 3D 分子をそのまま UniDockRunner に渡し、ETKDG conformer 生成を省略 → スクリーニング高速化
  • lib/docking:ProLIF 接触プロファイルを「目標分布」として与え、生成 → 評価ループの reward 信号に転用
  • GPCR ファミリー横断で形状汎化性を検証するベンチマーク基盤の構築
インパクト
  • ポケット 3D 接触を「リレーショナルグラフ」として直接条件にする SBDD 生成のリファレンスを提示
  • VAE 系で軽量なまま拡散モデル系の品質帯に届くアーキテクチャ選択肢を増やした
  • ProLIF 接触プロファイル一致を生成評価軸に据える流れを後押し