自然言語の指示(「位置2,3,5にメトキシ・ヒドロキシ・メチル基を持つ1,4-ベンゾキノン」)と分子構造(環トポロジー・官能基接続)の不一致がtext-guided molecular designの根本課題。SMILESではring構造が非隣接スパンに分断され、テキスト中の1単語「methoxy」が複数の原子・結合に対応するなど逐次性と非線形性の矛盾が生じる。
| 問題 | 解決策 |
|---|---|
| Developer-Debater Conflict | 専門LLM (Dev) ÷ 汎用LLM (Debater) 専門分業 |
| Global-Local Reasoning | RDKit Examiner で局所構造を決定論的に検証 |
| Static-Dynamic Integration | Refiner が不一致を指示文再構築に変換 |
Ablation: Examiner除去でEM低下+有効性スコア悪化を確認
| モデル | WSR avg | SR avg |
|---|---|---|
| Chem-R-8B | 0.421 | 0.621 |
| ChemDFM-R-14B | 0.421 | 0.621 |
| MSR (CoT) | 0.344 | 0.494 |
| Mol-Debate | 0.505 | 0.752 |
| 適用先 | ユースケース |
|---|---|
| lib/molgen | テキスト指示→SMILES生成の debate-refine ループ統合 |
| lib/molgen | ExaminerAgent を SMILES 後処理バリデーターとして単独実装 |
| lib/docking | 自然言語でリード最適化を指示するエージェント型ワークフロー |
コード: github.com/wyuzh/Mol-Debate