タンパク質–リガンド結合親和性 (PLA) 予測は仮想スクリーニングおよびリード最適化の中核タスクだが、既存手法は二系統に分裂している。Interaction-free モデル(GraphDTA など)はリガンドとタンパク質を独立にエンコードし、相互作用の細部を捉えにくい。Interaction-based モデル(IGN など)は複合体を直接モデル化するが、配列レベルの大域パターンを失いがちで、局所と大域を同時に活用するハイブリッド設計が確立されていない。
→ 個別特徴と相互作用特徴を並列に抽出し最終層で結合する Dual-Module 構成で両者の長所を統合する。
| 条件 | DualBind の挙動 |
|---|---|
| 3D 複合体構造あり | 標準データで RMSE −4.3% |
| 構造未解明標的 | 適用困難(GNN 入力欠如) |
| HDAC ファミリー | Zn 配位残基へのアテンション |
| bRo5 化合物 (PROTAC 等) | 未検証 |
| 大規模 VS スループット | 論文中に推論速度記載なし |
Interaction-free(Transformer)と Interaction-based(GNN)を二者択一でなく並列に走らせ最終層で結合する設計が PLA 予測の新たな基準となる。
Adaptive GNN は重みを入力特徴に応じて変更することで、共有結合と非共有相互作用(H 結合・疎水・静電)の異質性を陽に扱う。
HDAC8/6 で Zn 配位残基へアテンションが集中。予測根拠の解釈がメディシナルケミストの仮説検証に直結する。
3D 複合体が必須のため、AlphaFold モデルや AF3 予測複合体での頑健性、bRo5 への外挿、推論速度評価が今後の課題。