SBDD(Structure-Based Drug Design)型の生成モデルは増えているが、ポケット情報の与え方は依然として粗い表現に留まっている。多くは結合ポケットを scalar/vector の集約特徴量に潰すか、リガンドとタンパク残基の関係を 2D グラフに圧縮していた。結果として、ポケット形状や残基側鎖の幾何配置が生成分子に十分反映されず、ドッキングしてみると残基との実接触がずれる、というギャップが生じていた。
→ 本研究の動機:ポケット内のリガンド原子と残基原子の 3D 接触を「リレーショナルグラフ」として直接条件にした、軽量な cVAE で SBDD 生成を再構築する。
3D-Graph cVAE の中央値は 2D 条件付けより約 -1.7 kcal/mol 改善し、既知 D2R 活性体に近い帯に分布。
塩橋アンカー(D114)と TM5 セリン群(S193/S197)への接触で既知活性体プロファイルを再現。
2D 条件付けは疎水偏重で π-π / HBD が不足。3D-Graph 生成は既知活性体の構成バランスに最も近い。
| 指標 | 2D 条件 REINVENT | 3D-Graph cVAE | 既知活性 |
|---|---|---|---|
| Validity | 0.97 | 0.94 | — |
| Uniqueness | 0.92 | 0.96 | — |
| Novelty | 0.81 | 0.88 | — |
| QED 平均 | 0.58 | 0.62 | 0.65 |
| Glide score 中央値 (kcal/mol) | -7.4 | -9.1 | -9.7 |
| D114 接触率 (%) | 50 | 94 | 100 |
| π-π 接触割合 (%) | 24 | 29 | 26 |
Glide / D114 接触率 / π-π バランスで 3D-Graph cVAE が 2D ベースラインを上回り、既知活性プロファイルに最も近接。Validity だけはわずかに譲るがトレードオフ範囲。