1背景と課題
分子生成 AI は Reinvent (SMILES-RNN)・Graph-GA など個別フレームワークが乱立し、各々が単一の分子表現と単一の生成操作に固定されている。
- 表現が固定 → SMILES のみ / グラフのみ / 配列のみで切替不可
- 探索戦略が固定 → ヒット探索(広域)と
リード最適化(局所)の自動移行ができない
- LLM をトランジションとして組み込む統一基盤が無い
- ユースケース毎に別ツールを連結する運用負荷が大きい
課題: 1 ワークフロー内で表現型・操作・報酬関数を動的に切り替えられる汎用分子設計フレームワークが必要。
2手法の概要
ChemTSv3 は分子設計を抽象グラフ上の MCTS として定式化する。
- Node = 任意の分子状態 (SMILES / Graph / 3D / Protein-seq)
- Transition = SMILES 逐次変異 / Frag 編集 / LLM ガイド変換
- UCT 探索で多様性 (exploration) と高報酬集中 (exploitation) を制御
- 動的探索空間切替: α→β (広域→局所) / α→γ (別空間 pivot)
- v2 互換でユーザー定義報酬 (Docking, FEP, QED, SA…) を差し込み可
3本研究で示したこと
- 統一SMILES / Graph / 3D / Protein-seq を 同一 MCTS 上で扱える
- 動的α→β 自動移行でヒット探索→リード最適化を一気通貫
- LLM 統合LLM をトランジションとして組み込み、自然言語指示による分子変換
- v2 互換ユーザー定義報酬関数 (Docking, FEP, QED, SA…) をそのまま流用可
- 汎用小分子ドラッグライク生成 + タンパク質配列設計 で実証
結論: フェーズ切替により各フェーズ単独より高品質な設計候補を得られることを複数のベンチマークで確認。
意義: 分子設計 AI を「個別ツールの寄せ集め」から「単一の柔軟な探索基盤」へ移行する設計パラダイムを提示。
4主な結果(4 パネル)
aフェーズ別 設計候補品質(概念図)
単一フェーズより α→β 動的切替で最高スコアを達成(概念図、論文の趣旨を再現)。
bNode / Transition 抽象化アーキテクチャ
任意の Node 型 × 任意の Transition を MCTS コアにプラガブル接続。
c探索軌跡(化学空間 t-SNE 概念図)
α で広域散布 → 高報酬域に β クラスタ集中、想定外 hit に γ pivot で別空間へ移動。
dHit → Lead 一気通貫ファネル
v2 までは別ツール連携が必要だった hit→lead の流れを 1 ワークフロー で実現。
5テイクホームメッセージ
- UnifySMILES・Graph・3D・Protein-seq を 同一 MCTS で操れる初の汎用基盤。
- Dynamicα(広域)→β(局所)→γ(pivot) の動的探索空間切替が品質を底上げ。
- LLM-readyLLM をトランジションに統合 → 自然言語駆動の分子設計が現実に。
- Reward PlugDocking / FEP / QED / SA を v2 互換 API でそのまま接続可能。
- → 移植lib/molgen を Node/Transition 抽象に再構成すれば UniDockRunner や MMGBSAEngine を報酬関数として 1 ループ統合できる。
- 課題LLM API のコスト・レイテンシ、ロールアウト数増による高コスト報酬関数との両立、メモリ消費。
🔗 ChemTSv2: github.com/tsudalab/ChemTS / v3 公開予定あり (preprint 査読前)