Ontology-to-Tools Compilation for Executable Semantic Constraint Enforcement in LLM Agents

Zhou, Kraft et al. (Cambridge Centre for Computational Chemical Engineering) | arXiv: 2602.03439 | 2026年2月

🎯 OWL/RDFS オントロジーを MCP ツールに自動コンパイルし、LLM エージェントが知識グラフインスタンスを生成・修正する際に意味論的制約をリアルタイム強制する仕組みを構築する。

① 背景と課題

LLM が知識グラフ（KG）インスタンスを生成する際、オントロジー制約（クラス定義・値域制限等）への準拠を保証することが困難だった。従来の post-hoc バリデーション（生成後チェック）では制約違反の都度再生成が必要でコストが高く、複雑なオントロジーでは実用的でなかった。

Post-hoc バリデーション: 制約違反→再生成のループが多発しコスト大

LLM は形式的オントロジー制約を暗黙知識として保持できず、複雑な制約に対応困難

→ 制約をツールインターフェースとして実行時適用—生成と制約チェックを同時に実現

② 手法: Ontology→MCP ツールコンパイラ

② 手法: 自己修復ループ

③ 本研究で示したこと（要点）

④ 主な結果 (a) オントロジー準拠率向上

④ 主な結果 (b) MOP 合成情報抽出

MOP

金属有機多面体—合成条件（前駆体・溶媒・温度・時間）を KG に自動抽出

TWA

The World Avatar フレームワーク（Cambridge CARES）—実装基盤

文献テキスト → 構造化 KG インスタンスへの自動変換を実証

④ 主な結果 (c) Post-hoc vs 実行時強制

アプローチ	制約チェック	再生成コスト	スケーラビリティ
Post-hoc バリデーション	生成後	高い	△
本手法 (MCP ツール)	生成時	低い	✓

自己修復ループにより制約違反を即座に修正—後処理不要

④ 主な結果 (d) ケムインフォ応用可能性

⑤ テイクホームメッセージ

オントロジー×LLM 統合
形式的知識（OWL）と LLM の強みを組み合わせる新パラダイム。制約を「後処理」でなく「ツール」として扱う設計は汎用性が高い。

MCP との親和性
Claude/GPT 等の MCP 対応 LLM に直接適用可能。ケムインフォ LLM エージェントへの組み込みが技術的にシームレス。

限界
TWA フレームワーク依存。複雑オントロジーではツール数が膨大になり LLM のツール選択効率低下の恐れがある。

lib/molgen への応用
ChemOnt を MCP ツールに変換し MolgenYaml の SMILES 生成時に化学的妥当性を構造的に強制—無効分子率削減。

従来アプローチとの比較

手法	制約タイミング	自動修復	MCP対応
Post-hoc 検証	生成後	✗	-
Prompt Engineering	生成前	✗	-
SPARQL クエリ	生成後	✗	-
本手法	生成時	✓	✓

本研究のインパクト

lib/molgen: MolgenYaml の LLM バックボーンに ChemOnt MCP ツール層を追加—生成 SMILES の化学的妥当性を構造的に保証
化学文献からの自動 KG 構築—実験データ管理パイプラインへの応用
コード公開済み (TWA GitHub) — 実装プロトタイプの構築が即座に着手可能