DualBind: Dual-Module Protein-Ligand Binding Affinity Prediction with Adaptive GNN and Structure-Aware Transformer
Expert Systems With Applications, Vol. 309 | 2026 | DOI: 10.1016/j.eswa.2026.131109
GNN+Transformerの並列統合でPLA予測のRMSEを4.3%低減し、HDACのZn配位残基へアテンション集中を確認したデュアルモジュール設計
背景と課題

タンパク質–リガンド結合親和性 (PLA) 予測は仮想スクリーニングおよびリード最適化の中核タスクだが、既存手法は二系統に分裂している。Interaction-free モデル(GraphDTA など)はリガンドとタンパク質を独立にエンコードし、相互作用の細部を捉えにくい。Interaction-based モデル(IGN など)は複合体を直接モデル化するが、配列レベルの大域パターンを失いがちで、局所と大域を同時に活用するハイブリッド設計が確立されていない。

Interaction-free 系: 残基–原子の細粒度な接触情報が損失
Interaction-based 系: 配列上の長距離パターンが平坦化されやすい

→ 個別特徴と相互作用特徴を並列に抽出し最終層で結合する Dual-Module 構成で両者の長所を統合する。

手法の概要 — DualBind 並列構成
DualBind アーキテクチャ Protein seq. Ligand graph Structure-aware Transformer (Interaction-free) Adaptive GNN on complex (Interaction-based) Concat + MLP pKi / pIC50 Self-attention は局所/大域、GNN は分子内/分子間相互作用を分担
  • Adaptive GNN: メッセージ重みを入力特徴に応じて動的調整し、共有結合 / 水素結合 / 疎水 / 静電を区別
  • Structure-aware Transformer: 位置埋め込みに構造情報を注入し配列上の長距離残基相互作用を捕捉
本研究で示したこと
  • 3 ベンチマーク(PDBbind / BindingDB / ChEMBL)で SOTA を上回る予測精度
  • RMSE 平均 −4.3% を達成(GraphDTA・IGN との比較)
  • Pearson r・Spearman ρ も全データセットで優位
  • HDAC8 / HDAC6 で活性サイト残基 (Zn 配位残基) へアテンション集中
  • Interaction-free と Interaction-based の並列融合で個別寄与を解析可能
−4.3%
RMSE 平均削減(vs SOTA、3 データセット平均)
主な結果 (a) ベンチマーク RMSE
3 データセットでの RMSE 比較 1.0 1.4 1.8 RMSE (lower=better) PDBbind BindingDB ChEMBL GraphDTA IGN DualBind (−4.3% 平均)
主な結果 (b) HDAC アテンション
HDAC8 / HDAC6 アテンションヒートマップ HDAC8 ↑ Zn 配位残基 (His180/Asp178/His143) HDAC6 残基インデックス → low → high attention(活性サイトに集中)
主な結果 (c) モジュール寄与
アブレーション(モジュール除去時の RMSE 変化) 相対 RMSE (DualBind=1.00) 1.00 1.05 1.10 1.00 DualBind 1.043 w/o Adapt-GNN 1.045 w/o Trans. 片方のみではいずれも 4% 以上劣化、両モジュールの並列融合が必須
主な結果 (d) 適用条件と限界
条件DualBind の挙動
3D 複合体構造あり標準データで RMSE −4.3%
構造未解明標的適用困難(GNN 入力欠如)
HDAC ファミリーZn 配位残基へのアテンション
bRo5 化合物 (PROTAC 等)未検証
大規模 VS スループット論文中に推論速度記載なし
PDBbind の時系列 split が論文中で明記されておらずデータ漏洩リスクの精査が必要
テイクホームメッセージ
Dual-module で二系統を統合

Interaction-free(Transformer)と Interaction-based(GNN)を二者択一でなく並列に走らせ最終層で結合する設計が PLA 予測の新たな基準となる。

適応的メッセージパッシング

Adaptive GNN は重みを入力特徴に応じて変更することで、共有結合と非共有相互作用(H 結合・疎水・静電)の異質性を陽に扱う。

化学的に妥当なアテンション

HDAC8/6 で Zn 配位残基へアテンションが集中。予測根拠の解釈がメディシナルケミストの仮説検証に直結する。

構造依存性が残る

3D 複合体が必須のため、AlphaFold モデルや AF3 予測複合体での頑健性、bRo5 への外挿、推論速度評価が今後の課題。

計算化学パイプラインへの応用
  • lib/fep: MMGBSAEngine の前段プレフィルタとして DualBind 推論で候補を絞り、FEP 計算コストを削減
  • lib/docking: UniDockRunner ヒットの再スコアリング(Adaptive GNN の特徴を ProLIFCalculator の指紋と統合)
  • lib/molgen: MolgenYaml のスコアラーに DualBind 親和性予測を組み込み、生成分子のオンザフライ評価
インパクト
  • PLA 予測における二系統アーキテクチャの並列融合という設計指針
  • HDAC のような Zn 含有酵素で活性残基が解釈可能
  • PyTorch 公開実装あり(github.com/Arirhenium/DualBind)で再利用容易