Ontology-to-Tools Compilation for Executable Semantic Constraint Enforcement in LLM Agents
Zhou, Kraft et al. (Cambridge Centre for Computational Chemical Engineering) | arXiv: 2602.03439 | 2026年2月
🎯 OWL/RDFS オントロジーを MCP ツールに自動コンパイルし、LLM エージェントが知識グラフインスタンスを生成・修正する際に意味論的制約をリアルタイム強制する仕組みを構築する。
① 背景と課題

LLM が知識グラフ(KG)インスタンスを生成する際、オントロジー制約(クラス定義・値域制限等)への準拠を保証することが困難だった。従来の post-hoc バリデーション(生成後チェック)では制約違反の都度再生成が必要でコストが高く、複雑なオントロジーでは実用的でなかった。

Post-hoc バリデーション: 制約違反→再生成のループが多発しコスト大
LLM は形式的オントロジー制約を暗黙知識として保持できず、複雑な制約に対応困難

→ 制約をツールインターフェースとして実行時適用—生成と制約チェックを同時に実現

② 手法: Ontology→MCP ツールコンパイラ
Ontology → MCP Tools コンパイル OWL/RDFS オントロジー クラス・プロパティ・制約定義 (ChemOnt 等) Ontology-to-Tools コンパイラ (TWA) 関数シグネチャ・型チェック・値域制約を自動生成 MCP ツール群 各クラス・プロパティ操作の実行可能インターフェース LLM エージェント (Claude/GPT) MCP クライアントとして制約準拠 KG を生成
② 手法: 自己修復ループ
リアルタイム制約強制ループ LLM エージェント ツール呼び出し MCP ツール 制約チェック実行 ✓ OK KG 更新 ✗ エラー→修正 Post-hoc バリデーション不要—生成時に制約を強制
③ 本研究で示したこと(要点)
  • OWL オントロジーを MCP ツールに自動コンパイルする仕組みを初実装
  • MOP 合成文献からの情報抽出でオントロジー準拠率を大幅向上(制約適用前後比較)
  • 自己修復ループで制約違反からの自動回復を実証—再生成コストを削減
  • MCP 対応 LLM(Claude 等)と直接組み合わせ可能な設計
④ 主な結果 (a) オントロジー準拠率向上
KG インスタンス オントロジー準拠率 低い 大幅向上 素の LLM (制約なし) MCP 制約適用
④ 主な結果 (b) MOP 合成情報抽出
MOP
金属有機多面体—合成条件(前駆体・溶媒・温度・時間)を KG に自動抽出
TWA
The World Avatar フレームワーク(Cambridge CARES)—実装基盤

文献テキスト → 構造化 KG インスタンスへの自動変換を実証

④ 主な結果 (c) Post-hoc vs 実行時強制
アプローチ制約チェック再生成コストスケーラビリティ
Post-hoc バリデーション生成後高い
本手法 (MCP ツール)生成時低い

自己修復ループにより制約違反を即座に修正—後処理不要

④ 主な結果 (d) ケムインフォ応用可能性
計算化学パイプラインへの応用 ChemOnt / ClassyFire オントロジー → MCP MolgenYaml LLM 無効 SMILES 削減 実装優先度の検討 短期: RDKit.MolFromSmiles による軽量バリデーション 長期: ChemOnt MCP ツールで構造的な制約強制 github.com/cambridge-cares/TheWorldAvatar
⑤ テイクホームメッセージ
オントロジー×LLM 統合
形式的知識(OWL)と LLM の強みを組み合わせる新パラダイム。制約を「後処理」でなく「ツール」として扱う設計は汎用性が高い。
MCP との親和性
Claude/GPT 等の MCP 対応 LLM に直接適用可能。ケムインフォ LLM エージェントへの組み込みが技術的にシームレス。
限界
TWA フレームワーク依存。複雑オントロジーではツール数が膨大になり LLM のツール選択効率低下の恐れがある。
lib/molgen への応用
ChemOnt を MCP ツールに変換し MolgenYaml の SMILES 生成時に化学的妥当性を構造的に強制—無効分子率削減。
従来アプローチとの比較
手法制約タイミング自動修復MCP対応
Post-hoc 検証生成後-
Prompt Engineering生成前-
SPARQL クエリ生成後-
本手法生成時
本研究のインパクト
  • lib/molgen: MolgenYaml の LLM バックボーンに ChemOnt MCP ツール層を追加—生成 SMILES の化学的妥当性を構造的に保証
  • 化学文献からの自動 KG 構築—実験データ管理パイプラインへの応用
  • コード公開済み (TWA GitHub) — 実装プロトタイプの構築が即座に着手可能