Topology-Aware Generation and Activity-Based Filtering for Data-Scarce QAC Discovery
J. Chem. Inf. Model. | 2026 | DOI: 10.1021/acs.jcim.6c00390
トポロジー認識VAE+活性フィルタで、データ希少な抗菌QAC探索でも合成有望候補比率を9%→38%へ4倍化、11種の新規活性QACを獲得
① 背景と課題

四級アンモニウム化合物(QAC)は院内消毒・抗菌剤として広く用いられているが、近年QAC耐性菌の蔓延が深刻化し、新規QACスキャフォールドの開発が急務である。一方で公開されたQAC活性データは少数に留まり、汎用の生成AIや活性予測モデルの学習には不十分。

既存VAE生成では候補の多くが不活性 or 合成困難で、専門家のレビュー時間がボトルネック
QAC化学空間(四級N+分枝・環構造)に最適化されたグラフ表現が乏しい

→ データ希少領域で「生成 × 活性フィルタ × 専門家評価」を統合した閉ループワークフローを構築し、実合成・MIC評価で実証する。

② 手法の概要
  • QAC専用トポロジー認識VAE:四級N・環・分枝のグラフを潜在空間へ
  • 潜在空間サンプリングで新規QAC候補を生成
  • 少量の既知QACで活性予測モデル(4病原菌のMIC回帰)を学習
  • 少なくとも1株でMIC高活性予測のみを専門家へ提示(Workflow 2)
  • 合成化学者が実装可能性を判定し、実合成 → MIC測定でフィードバック
提案ワークフロー(Workflow 2) QAC graph Topo-VAE latent z Decoded candidates MIC pred. filter ≥1 strain Expert + synth S. aureus / E. coli / P. aeruginosa / C. albicans future: active learning loop
③ 本研究で示したこと
  • 専門家評価時間を等しく揃えた条件で、活性フィルタの有無を直接比較
  • 合成有望候補の比率が 9% → 38% に上昇(4倍以上)
  • 「化学的に無効な出力」が 21% → 0% に低減
  • 計29化合物を実合成・MIC評価し、新規QACを11種獲得(Workflow 2 由来)
  • 得られたヒットは MIC 1〜32 μM レンジでG+・G−・カンジダに作用
④-a 合成有望候補比率の比較
Workflow 1 vs 2: 候補の質的構成 100% 50% 0% Workflow 1 VAE → expert 9% 21% invalid Workflow 2 VAE → MIC filter → expert 38% 0% invalid 合成有望 合成困難など 化学的に無効

同じ専門家工数下で、フィルタ導入により 合成有望率が 9 → 38%、無効分子は 21 → 0% に。

④-b 新規ヒット獲得数(実合成→MIC)
合成 29 化合物中の活性ヒット数 15 10 5 0 3 Workflow 1 11 Workflow 2 MIC = 1〜32 μM の新規 QAC

活性フィルタにより、専門家が選んだ候補からヒット率も大幅向上(3 → 11)。

④-c MIC スペクトル(4 病原菌)
11 ヒットの MIC レンジ (μM) 1 2 8 16 32 MIC (μM, log) S. aureus 1–16 μM E. coli 2–32 μM P. aeruginosa 8–32 μM C. albicans 1–16 μM G+・G−・酵母にまたがる広域抗菌
④-d 数値ハイライト
9% → 38%
合成有望候補の割合(WF1 → WF2)
21% → 0%
化学的に無効な出力の割合
11 / 29
WF2 由来の合成化合物のうち抗菌活性ヒット数
1–32 μM
獲得した新規QACのMICレンジ(4病原菌)
⑤ テイクホームメッセージ
トポロジー特化生成
四級N・環・分枝を尊重したVAEは、汎用SMILES生成より「QACらしい」候補を高密度で出力できる。
活性フィルタの実利
専門家工数固定下で合成有望候補を 4 倍化、無効分子をゼロにする最も即効性のある介入。
小データでも実装可能
少量の既知QAC+MIC回帰でフィルタが機能。データ希少な抗菌・特殊機能性領域への移植が容易。
能動学習への次の一手
実合成・MIC結果をVAEと活性予測へ戻す閉ループは未実装。次世代化のキー要素として残されている。
応用補足(lib/molgen への移植)
  • MolgenYaml スコアラーに活性予測モデルを差し込み、専門家提示前のプレフィルタとして実装
  • JobManager 側で「QAC-likeトポロジー制約」をバイアス付きサンプラとして組み込む
  • 少データ・特殊化合物クラス(PROTAC, 蛍光プローブ等)への generic なテンプレ化
  • 実合成結果を YAML フィードバックループに登録し、能動学習で精度を逐次改善
インパクト
  • データ希少領域の生成AI設計に「活性フィルタ」を加える効果を、合成・MIC で実測した稀少な実証研究
  • QAC耐性問題に対し、新規スキャフォールド11種を即時供給
  • VAE × 活性回帰 × 専門家評価という現実的な3層パイプラインの最小構成例として広く転用可能