MicroCycle: An Integrated and Automated Platform to Accelerate Drug Discovery
Brocklehurst, Altmann, Bon … Wyler (Novartis) — J. Med. Chem. 2024, 67, 2118–2128 (DOI: 10.1021/acs.jmedchem.3c02029)
🎯 マイクロスケール合成 + 自動精製 + RF QSAR + Bayesian能動学習を1ループに統合。2018年以来1.2万化合物・平均純度94.1%を実証
① MicroCycle の全体像(DMTA 統合ループ)
Design: RF QSAR + Bayesian最適化(UCB/EI/Kriging Believer)→ 合成候補優先順位付け

Make: 96 well plate・2–6 μmol・Chemspeed iSYNTH + EP Motion 自動並列合成

Test: LC-MS 自動精製/定量/QC → 生化学・細胞アッセイ + ADME リアルタイム測定

Analyze: 全データ → QSAR 再訓練 → 次サイクルへフィードバック

Novartis Genesis Labs で 2018 年から稼働。複数疾患領域・複数モダリティに適用。

② 能動学習設計(Design)
  • Random Forest QSAR で活性 + 不確実性を予測
  • ADME(溶解性・脂溶性・CLint・透過性)も同時予測
  • UCB / EI / Kriging Believer で候補優先順位付け
  • 構造解析済みプロジェクトはドッキングで精製

仮想スペース全体から「最も情報量が多い」化合物を選択し、各サイクルの知識創出を最大化

③ マイクロスケール合成(Make)
2–6 μmol
96 well plate / well(通常スケールの 1/100)
  • 数十種の合成変換に対応(Suzuki等)
  • 固体試薬分注 + 液液抽出も自動化
  • グリーンケミストリー原則に準拠
  • 多段階合成もプレートフォーマットで対応
④ 自動精製・QC(Test)

UPLC-MS で酸性・塩基性 2 条件で粗製物解析 → 高純度フラクション自動回収 → 定量 → アッセイフォーマット化

94.1%
平均純度(中央値 95.0%)、>12,000 化合物の実績
④ 実績と成果
>12,000
登録ユニーク化合物数(2018–2022)
>380
高スループット実験数

NVP-002→NVP-003→NVP-004 と数サイクルで potency を段階的に向上(論文 Figure 5)

④ Bayesian 最適化の 3 手法
手法特性探索/活用
UCBμ + β·σβ で調整可
EI期待改善量探索寄り
Kriging Believer逐次バッチバッチ対応

RF の ensemble variance を不確実性の代理として使用

④ 設計の哲学
  • Molecular Obesity 回避:多パラメータ同時最適化
  • マイクロスケールで 1 サイクルあたり化合物数を最大化
  • 研究者バイアスを能動学習で補完・置換
  • ビルディングブロック多様性がスループットの鍵
⑤ テイクホームメッセージ
🔄 完全統合 DMTA が知識創出を加速
設計-合成-試験-解析を 1 ループに収め、サイクル期間を短縮。従来のハンドオフロスが消える。
🤖 能動学習が SAR 効率を最大化
不確実性推定 + Bayesian 最適化で「最も情報量が多い化合物」を選択。探索と活用のバランスを動的に制御。
🌿 マイクロスケールでグリーン化学
2–6 μmol は環境負荷を大幅削減しつつ、1 サイクルあたりの化合物数を劇的に増加。
📋 モジュラー設計で柔軟に拡張可能
新合成変換・新アッセイ・新 ML モデルをモジュールとして追加できるプラットフォーム思想。
ケムインフォmaticへの応用
適用先提案
lib/molgenRF QSAR + UCB/EI 能動学習ループを実装
lib/molgenKriging Believer でバッチ候補選択に対応
lib/dockingドッキングスコアをアクティブラーニングの補助フィーチャーに統合

MolgenYaml の acquisition_function に 'ucb' / 'ei' / 'kriging_believer' を選択可能にするだけで MicroCycle の設計哲学を実装できる

限界点
ビルディングブロック調達ロジスティクスが最大ボトルネック
ソフトウェア実装は非公開(Novartis 内部開発)
in vivo 試験用サンプル量確保には別途スケールアップ必要
定量的加速効果の外部検証データが乏しい