MicroCycle: Integrated Automated Drug Discovery Platform (Novartis)

MicroCycle: An Integrated and Automated Platform to Accelerate Drug Discovery

Brocklehurst, Altmann, Bon … Wyler (Novartis) — J. Med. Chem. 2024, 67, 2118–2128 (DOI: 10.1021/acs.jmedchem.3c02029)

🎯 マイクロスケール合成 + 自動精製 + RF QSAR + Bayesian能動学習を1ループに統合。2018年以来1.2万化合物・平均純度94.1%を実証

① MicroCycle の全体像（DMTA 統合ループ）

Design: RF QSAR + Bayesian最適化（UCB/EI/Kriging Believer）→ 合成候補優先順位付け
↓
Make: 96 well plate・2–6 μmol・Chemspeed iSYNTH + EP Motion 自動並列合成
↓
Test: LC-MS 自動精製/定量/QC → 生化学・細胞アッセイ + ADME リアルタイム測定
↓
Analyze: 全データ → QSAR 再訓練 → 次サイクルへフィードバック

Novartis Genesis Labs で 2018 年から稼働。複数疾患領域・複数モダリティに適用。

② 能動学習設計（Design）

Random Forest QSAR で活性 + 不確実性を予測
ADME（溶解性・脂溶性・CLint・透過性）も同時予測
UCB / EI / Kriging Believer で候補優先順位付け
構造解析済みプロジェクトはドッキングで精製

仮想スペース全体から「最も情報量が多い」化合物を選択し、各サイクルの知識創出を最大化

③ マイクロスケール合成（Make）

2–6 μmol

96 well plate / well（通常スケールの 1/100）

数十種の合成変換に対応（Suzuki等）
固体試薬分注 + 液液抽出も自動化
グリーンケミストリー原則に準拠
多段階合成もプレートフォーマットで対応

④ 自動精製・QC（Test）

UPLC-MS で酸性・塩基性 2 条件で粗製物解析 → 高純度フラクション自動回収 → 定量 → アッセイフォーマット化

94.1%

平均純度（中央値 95.0%）、>12,000 化合物の実績

④ 実績と成果

>12,000

登録ユニーク化合物数（2018–2022）

>380

高スループット実験数

NVP-002→NVP-003→NVP-004 と数サイクルで potency を段階的に向上（論文 Figure 5）

④ Bayesian 最適化の 3 手法

手法	特性	探索/活用
UCB	μ + β·σ	β で調整可
EI	期待改善量	探索寄り
Kriging Believer	逐次バッチ	バッチ対応

RF の ensemble variance を不確実性の代理として使用

④ 設計の哲学

Molecular Obesity 回避：多パラメータ同時最適化
マイクロスケールで 1 サイクルあたり化合物数を最大化
研究者バイアスを能動学習で補完・置換
ビルディングブロック多様性がスループットの鍵

⑤ テイクホームメッセージ

🔄 完全統合 DMTA が知識創出を加速
設計-合成-試験-解析を 1 ループに収め、サイクル期間を短縮。従来のハンドオフロスが消える。

🤖 能動学習が SAR 効率を最大化
不確実性推定 + Bayesian 最適化で「最も情報量が多い化合物」を選択。探索と活用のバランスを動的に制御。

🌿 マイクロスケールでグリーン化学
2–6 μmol は環境負荷を大幅削減しつつ、1 サイクルあたりの化合物数を劇的に増加。

📋 モジュラー設計で柔軟に拡張可能
新合成変換・新アッセイ・新 ML モデルをモジュールとして追加できるプラットフォーム思想。

ケムインフォmaticへの応用

適用先	提案
lib/molgen	RF QSAR + UCB/EI 能動学習ループを実装
lib/molgen	Kriging Believer でバッチ候補選択に対応
lib/docking	ドッキングスコアをアクティブラーニングの補助フィーチャーに統合

MolgenYaml の acquisition_function に 'ucb' / 'ei' / 'kriging_believer' を選択可能にするだけで MicroCycle の設計哲学を実装できる

限界点

ビルディングブロック調達ロジスティクスが最大ボトルネック

ソフトウェア実装は非公開（Novartis 内部開発）

in vivo 試験用サンプル量確保には別途スケールアップ必要

定量的加速効果の外部検証データが乏しい