AI時代の創薬標的同定・評価:GNN・LLM・生成AI・AlphaFold3の統合
Pun, Zhavoronkov et al. (Insilico Medicine 他) — Nature Reviews Drug Discovery 2026 | DOI: 10.1038/s41573-026-01412-8
🎯 AI で標的同定サイクルを加速:GWAS→GNN→生成AI→AlphaFold3 のパイプライン統合
→ UniDockRunner 標的自動選定・MolgenYaml への応用
① 背景:標的同定の課題

ヒトゲノム約 20,000 タンパク質コーディング遺伝子のうち、ドラッガブルなものは推定 4,500。しかし承認薬のターゲットはわずか 716 種(全ドラッガブルスペースの 16%)。伝統的な標的同定は数年単位を要し、臨床失敗が大きなボトルネック。

動物モデルのヒト疾患への予測力が限定的(成功率不足)
多オミクスデータの統合解析が手動では不可能なスケール
LLMなしでは数百万の文献からエビデンスを網羅できない
② AI標的同定の全体フロー
疾患生物学 (omics/GWAS/文献)
↓ Mendelian Randomization / 因果推論
↓ GNN × 知識グラフ (STRING/PrimeKG)
↓ LLM 文献マイニング・仮説生成
↓ AlphaFold3 構造予測・ドラッガビリティ
↓ 生成AI で化合物デザイン
↓ 自動化ラボで実験検証 → 臨床
③ 主要AI手法とデータソース
AI手法標的探索での役割
GNNPPI/パスウェイグラフで標的優先化
LLM/基盤モデル文献・特許からエビデンス抽出
生成AI新規分子スキャフォールド設計
AlphaFold3複合体構造予測・ドラッガビリティ
Mendelian Rand.遺伝的因果エビデンス定量化
Cell Painting ML形態変化から標的機能同定
④ 主な結果 (a) ヒト遺伝エビデンスの効果
1.0× 遺伝的証拠なし >2.0× 遺伝的証拠あり 臨床成功確率(相対値) 0

ヒト遺伝的エビデンスがある標的は臨床成功確率が2倍以上(文献推計)

④ 主な結果 (b) AI支援臨床入り事例
標的同定 生成AI hit生成 GAN/VAE 前臨床 FEP/MD Ph IIa陽性 ISM001 AI支援臨床例 • ISM001-055: Insilico Med. → IPF (特発性肺線維症) Phase IIa 陽性 • BGE-105 (BioAge): apelin受容体アゴニスト → 筋萎縮 Phase 1b 陽性 • dordaviprone: midline glioma → FDA加速承認(AI支援標的評価) • DepMap 426遺伝子: AI で癌依存性を予測、標的優先化に活用
④ 主な結果 (c) パイプライン応用戦略
  • lib/docking: GNN × STRING で標的優先化 → AlphaFold3 + fpocket → UniDockRunner 自動投入
  • lib/molgen: LLM による文献 SAR 抽出 → MolgenYaml スコアラー自動設定
  • lib/fep: ヒト遺伝的証拠付き標的への FEP 計算優先割当
④ 主な結果 (d) 限界と課題
AI予測標的の実験検証が律速(コスト・時間)
公開オミクスデータの疾患・人種偏りが汎化を制限
GNN/LLMのブラックボックス問題:解釈性不足
著者の利益相反(商業企業所属)に注意

AIは仮説生成・優先化を支援するが最終検証は依然として臨床試験に依存。