新薬開発は10〜15年・最大2.5B$ を要し、毒性・副作用に起因する後期失敗が大きな損失要因となる。DDI(薬剤-薬剤)、DTI(薬剤-標的)、ADR(有害事象)の早期計算評価は、その失敗を前倒しで検出する有力な手段である。
→ 2020-2025 年の 100 本超の DL/ML/Graph/LLM ハイブリッド研究を整理し、現状と課題を見える化
レビュー対象を 4 つの方法論カテゴリに分け、それぞれの代表モデルとベンチマーク性能を一覧比較する。
各カテゴリの代表手法を Table 3 で 100+ 論文分一覧化し、データセット・評価指標・出典を直接比較可能にする。
BioBERT・SciBERT・GPT 系モデルが文献マイニング・抄録からの DDI トリプル抽出に活用され、半教師あり学習データを自動生成する流れを整理。
LLM 連携で文献抽出 → 関係分類 → モデル訓練の半自動パイプラインが現実化。
DDI-Extraction 2013 / TAC2018-19 でのF1 一覧
| 手法 | DDI-Ext 2013 F1 |
|---|---|
| CNN ベース | 0.69-0.75 |
| BiLSTM-CRF | 0.78-0.81 |
| BioBERT-LSTM-CRF | 0.82-0.85 |
| Hybrid GCN+LLM | 0.85-0.87 |
Davis / KIBA での MSE と CI
| 手法 | Davis MSE | KIBA CI |
|---|---|---|
| DeepDTA (CNN) | 0.261 | 0.863 |
| GraphDTA (GCN) | 0.245 | 0.881 |
| MolTrans (Trans.) | 0.226 | 0.901 |
本レビューで整理されたベンチマーク群
| データセット | 用途 |
|---|---|
| DDI-Extraction 2013 | DDI 抽出 |
| TAC 2018/2019 | FDA SPL DDI |
| ADE-Corpus-V2 | ADE 抽出 |
| Davis / KIBA | DTI 親和性回帰 |
| CMED / Human | 臨床ノート / ゲノム |
近年のモデル間で性能差が縮小している現状
主戦場は「より良いモデル」から「より良いデータ・評価プロトコル」へ移行している、と著者は結論。
| 適用先 | ユースケース |
|---|---|
| lib/docking | UniDock 後段で DDI/DTI 予測スコア追加 |
| lib/molgen | MolgenYaml に DDI/ADR ペナルティ統合 |
| lib/molgen | 社内文献から LLM で DDI 知識自動構築 |
既存 GCN/Transformer 推論モデルを scorer として組み込むだけで臨床リスクの早期検出が可能