反応インフォマティクスは RDChiral・CGRtools・RDKit・OpenEye 等の断片化したツール群で構成され、相互運用性が低く専門外研究者への障壁が高い。各ツールはそれぞれ固有のデータ形式を持ち、パイプライン統合時に変換コストと不整合が生じる。
→ DPO グラフ変換理論に基づく統合フレームワーク SynKit を提案。中間体・遷移順序を保存した MTG を導入。
ITS グラフ(反応物+生成物のスーパーグラフ)を拡張し、n ステップの反応に対して各エッジに長さ n+1 の結合次数ベクトルを付与。
アルドール付加の例: net ITS では失われる互変異性化ステップが MTG で明示的に保存される。機構認識型テンプレート抽出に直結。
| 手法 | 精度 | 速度 |
|---|---|---|
| SynKit Exact | 100% | med 0.46 ms |
| WLGH3 | 95%(近似) | avg 3.98 ms |
| RDCanon | 94% | — |
Exact は対称構造で稀に遅くなる(平均 266 ms だが中央値 0.46 ms)
purity = ARI = NMI = 1.0(VF2 厳密同型と完全一致)
270 fine-grained ルールに収束(RDChiral の 1892 テンプレートより少ない)
約 2.9 ms/クエリ。逐次 SubgraphMatch と同一結果。現状は単純無向グラフ対応(平行エッジ非対応)。
| バックエンド | 特徴 | ライセンス |
|---|---|---|
| SynReactor | 暗黙水素対応・軽量 | MIT |
| MODReactor | 全般的高速 | GPL |
SING 前段フィルタで SynReactor を約 1.7× 高速化可能
| 適用先 | ユースケース |
|---|---|
| lib/molgen | DPO ルール組成で合成経路プリミティブ実装 |
| lib/docking | WL4+SING で反応テンプレートクラスタリング前処理 |
| lib/molgen | SynReactor をフォワード/バックワード予測エンジンに統合 |
反応正規化を lib/molgen の入力前処理として使えば重複テンプレートを排除し训練データ品質を向上できる