AI in Drug Target Identification — Nat Rev Drug Discov 2026

AI時代の創薬標的同定・評価：GNN・LLM・生成AI・AlphaFold3の統合

Pun, Zhavoronkov et al. (Insilico Medicine 他) — Nature Reviews Drug Discovery 2026 | DOI: 10.1038/s41573-026-01412-8

🎯 AI で標的同定サイクルを加速：GWAS→GNN→生成AI→AlphaFold3 のパイプライン統合
→ UniDockRunner 標的自動選定・MolgenYaml への応用

① 背景：標的同定の課題

ヒトゲノム約 20,000 タンパク質コーディング遺伝子のうち、ドラッガブルなものは推定 4,500。しかし承認薬のターゲットはわずか 716 種（全ドラッガブルスペースの 16%）。伝統的な標的同定は数年単位を要し、臨床失敗が大きなボトルネック。

動物モデルのヒト疾患への予測力が限定的（成功率不足）

多オミクスデータの統合解析が手動では不可能なスケール

LLMなしでは数百万の文献からエビデンスを網羅できない

② AI標的同定の全体フロー

疾患生物学 (omics/GWAS/文献)
↓ Mendelian Randomization / 因果推論
↓ GNN × 知識グラフ (STRING/PrimeKG)
↓ LLM 文献マイニング・仮説生成
↓ AlphaFold3 構造予測・ドラッガビリティ
↓ 生成AI で化合物デザイン
↓ 自動化ラボで実験検証 → 臨床

③ 主要AI手法とデータソース

AI手法	標的探索での役割
GNN	PPI/パスウェイグラフで標的優先化
LLM/基盤モデル	文献・特許からエビデンス抽出
生成AI	新規分子スキャフォールド設計
AlphaFold3	複合体構造予測・ドラッガビリティ
Mendelian Rand.	遺伝的因果エビデンス定量化
Cell Painting ML	形態変化から標的機能同定

④ 主な結果 (a) ヒト遺伝エビデンスの効果

ヒト遺伝的エビデンスがある標的は臨床成功確率が2倍以上（文献推計）

④ 主な結果 (b) AI支援臨床入り事例

④ 主な結果 (c) パイプライン応用戦略

lib/docking: GNN × STRING で標的優先化 → AlphaFold3 + fpocket → UniDockRunner 自動投入
lib/molgen: LLM による文献 SAR 抽出 → MolgenYaml スコアラー自動設定
lib/fep: ヒト遺伝的証拠付き標的への FEP 計算優先割当

④ 主な結果 (d) 限界と課題

AI予測標的の実験検証が律速（コスト・時間）

公開オミクスデータの疾患・人種偏りが汎化を制限

GNN/LLMのブラックボックス問題：解釈性不足

著者の利益相反（商業企業所属）に注意

AIは仮説生成・優先化を支援するが最終検証は依然として臨床試験に依存。