StereoMolGraph: Stereochemistry-Aware Molecular and Reaction Graphs
J. Chem. Inf. Model. 2026, 66, 3830-3839 | Published: 2026 | DOI: 10.1021/acs.jcim.5c02523
群論ベースの置換不変な局所立体記述子で、対称分子・非四面体中心・遷移状態の立体化学をグラフ表現で正確に扱うオープンソースPython基盤
(1) 背景と課題:分子グラフ表現の立体化学限界

分子グラフはケモインフォマティクスとGNNベース機械学習の基盤表現だが、対称性と立体化学の相互依存という原理的課題を抱える。Canonical SMILES / InChI は四面体中心と E/Z 二重結合は扱えるが、以下のケースで破綻する:

対称分子では分子全体のグラフ同型性が立体中心の区別を不可能にし、エナンチオマーの識別が曖昧になる
四角平面・八面体配位の金属錯体など非四面体立体中心に対応する標準表現が存在しない
遷移状態 (TS) の一時的立体化学(コンロタトリー vs ジスロタトリーなど)は SMILES/InChI の枠組み外

CIP (Cahn-Ingold-Prelog) 規則は化学者が手動適用するために設計されており、計算機での厳密処理に不向き。

→ 群論的に厳密かつ置換不変な局所立体記述子で、対称性問題から立体化学記述を切り離す

(2) 手法の概要:局所立体記述子
  • 各立体中心に独立な局所記述子を付与(分子全体のカノニカル化に非依存)
  • 隣接原子の空間配列を置換群の元として表現
  • 四面体: S4 / 四角平面: D4h / 八面体: Oh ─ 各点群に対応
  • 反応縮約グラフ上で立体記述子を保持し TS 立体選択性を扱う
  • RDKit Mol との双方向変換 API を提供
立体中心タイプ × 対応点群 四面体 S4 既存SMILES対応 四角平面 D4h SMILES非対応 八面体 Oh SMILES非対応
(3) 本研究で示したこと
  • 群論ベースの置換不変立体記述子フレームワークを実装
  • 対称分子のエナンチオマー / ジアステレオマー自動識別を実証
  • 四角平面・八面体錯体など非四面体中心を統一的に扱える
  • 反応縮約グラフ上でコンロタトリー vs ジスロタトリー経路を区別
  • RDKit 双方向変換と立体可視化を提供しパイプラインへ統合容易
  • MIT ライセンスで GitHub / PyPI / Zenodo に公開
(4-a) 表現可能な立体中心タイプの被覆
立体表現の被覆: SMILES/InChI vs StereoMolGraph 不可 部分 四面体 E/Z 対称分子 非四面体 SMILES/InChI StereoMolGraph

既存表現は四面体・E/Z は確実に扱えるが、対称分子のエナンチオマー識別・非四面体中心では破綻。StereoMolGraph は4軸すべてで対応。

(4-b) エナンチオマー判定フロー
グラフ同型 + 局所立体記述子比較フロー Mol A, Mol B 2分子入力 グラフ同型 原子接続一致? Yes 局所記述子 置換群比較 S4 / D4h / Oh 構造異性体 同一/立体異性 エナンチオ / ジアステレオ判定 対称分子でも記述子が局所独立 → エナンチオマー検出が可能 CIP規則で曖昧な対称分子のケースで確実に機能
(4-c) 周環反応の経路区別
反応縮約グラフ:コンロタトリー vs ジスロタトリー 反応物 ジエン コンロタトリー 熱・4π / 6π光 ジスロタトリー 光・4π / 熱 6π 生成物 (trans) 立体記述子 σA 生成物 (cis) 立体記述子 σB TS の一時的立体化学を反応縮約グラフで保持 → 経路ごとに σA ≠ σB
(4-d) RDKit統合と公開状況
項目内容
言語Python (Pure Python)
ライセンスMIT
導入pip install StereoMolGraph
RDKit変換双方向 (Mol ⇄ SMG)
可視化立体記述子付与の構造描画
反応グラフ縮約グラフ + TS立体保持
テスト有機分子・金属錯体・TS
公開リソース
GitHub: maxim-papusha/StereoMolGraph
PyPI: StereoMolGraph
Zenodo: 16360310
(5) テイクホームメッセージ
置換不変な局所立体記述子
分子全体のカノニカル化に依存せず、各立体中心へ独立に群論的記述子を付与する設計が問題の本質を解く。
対称分子問題の解消
分子全体のグラフ同型性が立体識別を妨げる従来の障壁を、記述子の局所性で除去。
非四面体・遷移状態へ拡張
D4h / Oh 等の点群対応で金属錯体や TS 立体化学まで一つの枠組みでカバーする。
エコシステム接続性
RDKit との双方向変換 + MIT + PyPI で既存パイプラインへすぐ載せられる実装可用性。
応用補足:パイプラインでの利用

lib/molgen: 生成分子の立体異性体重複排除と非四面体中心を含む生成空間の正準化に活用。

lib/docking: ProLIF 解析で金属錯体ターゲットの立体特異的相互作用を区別する識別子として導入。

lib/fep: エナンチオマー対の自動マッピング検証に利用、CIP 規則依存の現行ワークフローの曖昧性除去。

論文中では定量ベンチマークが限定的、独自ライブラリでの精度比較は別途必要
インパクト
  • GNN/3D構造モデルへの立体特徴入力として標準的利用が見込まれる
  • 金属錯体創薬・有機金属触媒分野でのML応用障壁を低下
  • 反応経路探索・QM/MMにおけるTS立体化学の機械可読化を促進