ChemTSv3: Generalizing Molecular Design via Flexible Search Space Control

DOI: 10.26434/chemrxiv-2025-kdvrt Category: machine_learning RIKEN / Yokohama City Univ. / Tokyo Inst. Sci. (2025, ChemRxiv) 🎯 ゴール: 表現・操作・報酬を抽象化した汎用MCTS分子生成フレームワーク

1背景と課題

分子生成 AI は Reinvent (SMILES-RNN)Graph-GA など個別フレームワークが乱立し、各々が単一の分子表現と単一の生成操作に固定されている。

課題: 1 ワークフロー内で表現型・操作・報酬関数を動的に切り替えられる汎用分子設計フレームワークが必要。

2手法の概要

ChemTSv3 は分子設計を抽象グラフ上の MCTS として定式化する。

α SMILES変異 (広域探索) β グラフ編集 (局所最適化) γ LLM pivot (別化学空間) 候補 分子

3本研究で示したこと

結論: フェーズ切替により各フェーズ単独より高品質な設計候補を得られることを複数のベンチマークで確認。

意義: 分子設計 AI を「個別ツールの寄せ集め」から「単一の柔軟な探索基盤」へ移行する設計パラダイムを提示。

4主な結果(4 パネル)

aフェーズ別 設計候補品質(概念図)

0 0.5 1.0 報酬スコア (norm.) 0.62 0.74 1.06 SMILES-only Graph-only ChemTSv3 (α→β) 動的切替
単一フェーズより α→β 動的切替で最高スコアを達成(概念図、論文の趣旨を再現)。

bNode / Transition 抽象化アーキテクチャ

MCTS (UCT) core engine SMILES Mol Graph 3D Conformer Protein Seq Node 型 SMILES 変異 Frag 編集 LLM 変換 Custom Transition
任意の Node 型 × 任意の Transition を MCTS コアにプラガブル接続。

c探索軌跡(化学空間 t-SNE 概念図)

t-SNE dim 1 t-SNE dim 2 β リード最適化 (n≈7) γ LLM pivot α 広域 β 局所 γ pivot
α で広域散布 → 高報酬域に β クラスタ集中、想定外 hit に γ pivot で別空間へ移動。

dHit → Lead 一気通貫ファネル

α SMILES 変異 (広域) β グラフ編集 (局所) 報酬関数 (Dock/FEP/QED) Lead ~10^4 候補 ~10^3 候補 ~10^2 候補 10–30
v2 までは別ツール連携が必要だった hit→lead の流れを 1 ワークフロー で実現。

5テイクホームメッセージ

🔗 ChemTSv2: github.com/tsudalab/ChemTS / v3 公開予定あり (preprint 査読前)