Accelerated Chemical Reaction Optimization Using Multi-Task Learning
DOI: 10.1021/acscentsci.3c00050  |  2023  |  Category: machine_learning  |  ACS Central Science
過去の反応最適化データを転移学習するマルチタスクBOで実験反復数を50〜70%削減。自律フロー反応器で実証済み。分子最適化ループへの応用も有望。#BayesianOptimization #ReactionOptimization
① 背景と課題

C-H 活性化をはじめとする医薬品合成における反応最適化は、溶媒・触媒・温度・当量など多次元の条件空間を網羅的に探索する必要があり、膨大な試行錯誤を要する。Shields ら(2021)が確立したベイズ最適化(BO)は探索効率を大きく改善したが、各最適化キャンペーンが「事前情報ゼロ」のシングルタスク設定で開始するため、組織内に蓄積された豊富な反応データが活用されないという根本的な非効率が残存していた。

ギャップ: 過去の関連反応データを活用する転移学習的アプローチが反応最適化分野で未確立。シミュレーション止まりで、実際の自律フロー反応器での性能実証も不足。
50〜70%
本研究で達成した実験反復数の削減率(vs シングルタスク BO)
② 手法の概要 — MTBO アーキテクチャ
過去Task A 過去Task B 過去Task C 新規Task (コールドスタート) MTGP ICM / LCM EI 獲得関数 次条件提案 → 自律フロー反応器で実験 → タスク間相関を更新

マルチタスクガウス過程(MTGP)が ICM/LCM カーネルでタスク間相関をモデル化。EI 獲得関数が次の実験条件を提案し、自律フロー反応器が実行・データ蓄積を担うクローズドループ。

③ 本研究で示したこと
  • マルチタスク BO(MTBO)が C-H 活性化を含む反応最適化で 実験反復数 50〜70% 削減 を達成
  • MTGP(ICM/LCM カーネル)でタスク間相関を共分散行列として明示的にパラメータ化
  • 「異なる基質・同じ触媒系」のタスク間で 高い転移効率 を確認
  • シミュレーションだけでなく 実物の自律フロー反応器 上で wet lab 実証
  • BoTorch の MultiTaskGP で再現可能、SI に GitHub 言及あり
④-a 実験反復数の削減(主要指標)
最適収率到達までの実験回数 100 75 50 25 実験回数 STBO 100 MTBO(50%減) 50 MTBO(70%減) 30 同等の最適収率到達条件で比較
④-b ベンチマーク検証

複数のインシリコベンチマーク(公開反応データセット)と、実際の自律フロー反応器を用いた wet lab 実験の両方で検証。シングルタスク BO 比で必要な実験反復数を 50〜70% 削減しつつ最適収率を達成。「異なる基質だが同じ触媒系」のタスク間で特に高い転移効率を確認した。

2 系統
検証環境(インシリコ + 実機自律フロー)
完全自律
人手介入を最小化した最適化ループ
④-c タスク間相関と転移効率
タスク類似度 vs MTBO 改善率 70% 50% 25% 0% タスク間相関(同一触媒系→高) 5% 15% 35% 55% 70% 同一触媒系 異触媒
④-d 限界点・残る議論
  • タスク間相関が低い場合(全く異なる化学変換・触媒機構)は MTBO の優位性が縮小
  • タスク数が増えると MTGP の学習コストが 急激に増大
  • 溶媒種など 離散カテゴリカルパラメータ の効率的な扱いに工夫が必要
  • 自律フロー反応器との統合は産業環境では 参入障壁が高い(設備投資・統合工数)
⑤ テイクホームメッセージ
転移学習で BO を加速
過去の反応最適化データを MTGP に流し込むだけで実験反復を 50〜70% 削減できる。
タスク類似度がカギ
「同一触媒系・異基質」など化学的に近いタスク間で転移効率が最大化される。
Wet lab 実証済み
シミュレーション止まりではなく自律フロー反応器に接続したリアル実験で性能を確認。
BoTorch で再現可能
MultiTaskGP + EI で実装でき、論文 SI に GitHub 言及あり。導入コストが低い。
ケムインフォマティクス応用
適用先モジュールユースケース
lib/molgenキナーゼ阻害剤シリーズ SAR を「タスク」化し、関連ファミリー別シリーズ最適化を加速(多目的 MTBO で活性・選択性・ADMET を同時最適化)
lib/fep過去類似ターゲットの FEP/ドッキングスコアをサロゲート転移し、MolgenYaml オラクル呼び出しコストを削減
本研究のインパクト
  • 反応最適化分野で初めてマルチタスク BO を 実機自律反応器 で実証
  • 組織内蓄積データを資産化する 転移学習パラダイム を提示
  • 分子設計・リード最適化など創薬全般への 応用ポテンシャル が高い