A Systematic Review: Drug-Related Interactions with Deep Learning and LLMs
DDI / DTI / ADR を 100+ 論文で網羅整理(ACS Omega 2025, Behrooznia & Hooshmand)
🎯 創薬パイプライン全体での薬剤安全性評価をDL/LLM技術で再構築する道筋を示す
① 背景と課題

新薬開発は10〜15年・最大2.5B$ を要し、毒性・副作用に起因する後期失敗が大きな損失要因となる。DDI(薬剤-薬剤)、DTI(薬剤-標的)、ADR(有害事象)の早期計算評価は、その失敗を前倒しで検出する有力な手段である。

既存研究は DDI / DTI / ADR を別々に扱っており、3課題を統合した end-to-end 評価フレームワークが存在しない
データセット偏り・LLMハルシネーション・3D 情報の希薄さが臨床応用への壁

→ 2020-2025 年の 100 本超の DL/ML/Graph/LLM ハイブリッド研究を整理し、現状と課題を見える化

② 手法: 4カテゴリの分類整理

レビュー対象を 4 つの方法論カテゴリに分け、それぞれの代表モデルとベンチマーク性能を一覧比較する。

DL(CNN/RNN/Transformer)
↓ ML(RF/SVM/回帰)
↓ Graph(GCN/GAT/MR-GNN)
↓ Hybrid(DL+Graph+LLM)
↓ 統合フレームワーク(提案・将来課題)

各カテゴリの代表手法を Table 3 で 100+ 論文分一覧化し、データセット・評価指標・出典を直接比較可能にする。

② 手法: NLP / LLM の役割

BioBERT・SciBERT・GPT 系モデルが文献マイニング・抄録からの DDI トリプル抽出に活用され、半教師あり学習データを自動生成する流れを整理。

100+論文
2020〜2025 年の DDI/DTI/ADR 関連を網羅

LLM 連携で文献抽出 → 関係分類 → モデル訓練の半自動パイプラインが現実化。

③ 本研究で示したこと(要点)
  • DDI / DTI / ADR の 3 課題を同一視点で初めて系統整理
  • DL / ML / Graph / Hybrid の 4 カテゴリ × 主要データセットで性能を一覧化
  • LLM が 2024 年以降に文献抽出と関係分類で大きな影響を与えていることを明示
  • 3 課題統合フレームワークの不在を最大ギャップとして提唱
④ 主要結果 (a) DDI 抽出ベンチマーク

DDI-Extraction 2013 / TAC2018-19 でのF1 一覧

手法DDI-Ext 2013 F1
CNN ベース0.69-0.75
BiLSTM-CRF0.78-0.81
BioBERT-LSTM-CRF0.82-0.85
Hybrid GCN+LLM0.85-0.87
④ 主要結果 (b) DTI 予測(Davis / KIBA)

Davis / KIBA での MSE と CI

手法Davis MSEKIBA CI
DeepDTA (CNN)0.2610.863
GraphDTA (GCN)0.2450.881
MolTrans (Trans.)0.2260.901
④ 主要結果 (c) 主要データセット

本レビューで整理されたベンチマーク群

データセット用途
DDI-Extraction 2013DDI 抽出
TAC 2018/2019FDA SPL DDI
ADE-Corpus-V2ADE 抽出
Davis / KIBADTI 親和性回帰
CMED / Human臨床ノート / ゲノム
④ 主要結果 (d) 性能の頭打ち兆候

近年のモデル間で性能差が縮小している現状

Plateau
DDI/DTI ベンチマークで F1/MSE が飽和

主戦場は「より良いモデル」から「より良いデータ・評価プロトコル」へ移行している、と著者は結論。

⑤ テイクホームメッセージ
📚 100+ 論文の俯瞰整理
DDI / DTI / ADR の 3 課題を同一フレーミングで比較できる初の包括的レビュー。
🤖 LLM が研究地図を変える
抄録抽出と関係分類で BioBERT・GPT 系の影響が顕著。半教師ありデータ生成が現実化。
📊 性能のプラトーが顕在化
主要ベンチマークでモデル間差が縮小し、データ品質と評価プロトコルが新しい論点に。
🧩 3課題統合の欠落が最大ギャップ
DDI/DTI/ADRを同時に扱う end-to-end フレームワークが将来課題として明示。
ケムインフォマティクスへの応用
適用先ユースケース
lib/dockingUniDock 後段で DDI/DTI 予測スコア追加
lib/molgenMolgenYaml に DDI/ADR ペナルティ統合
lib/molgen社内文献から LLM で DDI 知識自動構築

既存 GCN/Transformer 推論モデルを scorer として組み込むだけで臨床リスクの早期検出が可能

本研究のインパクト
  • DDI/DTI/ADR を一望できる「現状地図」を研究者に提供
  • LLM 連携の臨床リスク評価パイプラインへの方向性を提示
  • 計算化学パイプラインの安全性スコア統合に向けた具体的指針