BOLD-GPCRs: A Transformer-Powered App for Predicting Ligand Bioactivity across Class A GPCRs
J. Chem. Inf. Model. 66, 855-866 | Published 2026 | DOI: 10.1021/acs.jcim.5c01858
Class A GPCR 826 サブタイプを単一 Transformer モデルで横断予測。配列類似性ベース転移学習でデータ希少 GPCR の活性・変異効果を補完し Web アプリ化。
① 背景と GPCR 創薬のデータ偏在

Class A GPCR は 826 サブタイプあり、うち 165 以上が現行の創薬標的だが、ChEMBL に蓄積したリガンド活性データは β2-AR・D2R・κ-OR など一部に集中している。データ希少サブタイプ(多くのオーファン GPCR を含む)では標的個別モデルの汎化性能が大きく劣化し、変異効果(薬物耐性・選択性スイッチ)の予測も困難である。

標的個別モデルは少データで過学習しやすく、希少 GPCR の活性予測は実用域に届かない。
既存ツールは活性予測のみで、点変異が結合に与える影響を統合的に扱えない。

→ GPCR ファミリー全体を単一モデルで扱い、配列類似性をブリッジに知識を転移できないか?

② 二経路 BERT エンコーダ + 転移学習
  • タンパク質側: ESM 系プロテイン BERT で GPCR 配列を埋め込み
  • リガンド側: ChemBERTa で SMILES を埋め込み
  • 両ベクトルを連結し全結合 MLP で pChEMBL 閾値以上を二値分類
  • Class A 全体で事前学習 → 希少 GPCR にファインチューン
  • 変異効果は WT − Mut のスコア差で評価
GPCR 配列 ESM (Protein BERT) SMILES ChemBERTa Concat MLP Active/Inactive Dual-BERT 結合活性予測パイプライン
③ 検証で示したこと
  • データ豊富 GPCR(β2-AR, D2R, κ-OR)でベースラインに匹敵する AUROC を維持
  • データ希少 Class A GPCR で個別モデルより AUROC が有意に向上
  • 既知の活性化/不活性化変異の効果方向を正しく再現
  • オーファン GPCR のリガンド優先順位付けに応用可能
  • Web アプリとして実験化学者向けに公開
④ (a) 希少 GPCR 上の AUROC 改善
標的個別 vs BOLD-GPCRs (AUROC) 1.0 0.8 0.6 0.5 β2-AR / D2R .88 .89 中等量 GPCR .78 .84 希少 GPCR .62 .79 標的個別 BOLD-GPCRs データ量別の代表サブタイプ群(概念図)
④ (b) Class A 826 サブタイプのデータ偏在
Class A GPCR ファネル Class A GPCR ≈ 826 サブタイプ 創薬標的 ≧ 165 十分な ChEMBL 活性データあり 少数のホット標的 下層ほどリガンド情報が枯渇 → 転移学習が効く層
④ (c) 変異効果スコア (WT − Mut)
活性化 / 不活性化 変異の符号一致 ΔScore = 0 不活性化変異 (実験) 活性化変異 (実験) 予測 ΔScore < 0 予測 ΔScore > 0
④ (d) 適用範囲と前提
項目BOLD-GPCRs
対象Class A GPCR (826 サブタイプ)
創薬標的カバー165 以上
出力active / inactive 二値
転移学習源データ豊富 GPCR + 配列類似性
変異入力WT 配列 vs 変異配列
提供形態Web アプリ
非対象Class B / C / F GPCR
Ki/IC50 の連続値ではなく pChEMBL 閾値の二値判定。
オーファン GPCR や未知変異への外挿は不確実性が残る。
⑤ テイクホームメッセージ
家族横断の単一モデル
サブタイプごとの個別モデル運用から、Class A 全 826 を一つの Dual-BERT で扱う設計に転換。
転移学習が効く層は希少 GPCR
データ豊富領域では同等、希少領域で AUROC が大きく改善し、創薬の死角を埋める。
変異効果の同時予測
WT−Mut のスコア差で薬物耐性・活性化変異の方向性を再現し、選択性設計に寄与。
実験家にそのまま渡せる
Web アプリ化により、SMILES と GPCR 名のみで活性ランキングと変異感度を取得可能。
パイプラインへの応用

lib/docking: GPCR 特化 LBVS のプリフィルタとして使用し、UniDockRunner に流すコンパウンドを Class A 横断で絞り込む。

lib/molgen: MolgenYaml のスコアラーとして BOLD-GPCRs の活性確率を組み込み、ターゲット GPCR +オフターゲット GPCR の選択性を最適化。

lib/fep: 変異効果スコアでホットスポット残基を抽出し、MMGBSAEngine/FEP の系設計(変異リング)を効率化。

インパクト
  • オーファン/希少 GPCR の再注目を後押し
  • 変異耐性プロファイルを設計初期に評価可能
  • Web アプリ提供で実験家との協働サイクルを短縮