新薬開発では、標的タンパク質同定(Target ID)に月単位の時間が必要。薬学化学者は3基準を別々ツールで手動確認している: C1(物理・機能的相互作用 → STRING)、C2(治療的影響 → Google Scholar)、C3(ドッキングポテンシャル → SwissTargetPrediction)。
→ KG-RAGとDiffDockを統合グラフUIに組み込み、発散・収束思考の反復サイクルを設計原理として実装
| 基準 | 従来ツール | HAPPIER |
|---|---|---|
| C1: PPI相互作用 | STRING(手動) | サブグラフ自動分割 |
| C2: 治療的影響 | Google Scholar検索 | KG-RAG (0-100スコア) |
| C3: ドッキング | SwissTarget 1件ずつ | DiffDock 並列実行 |
実装: LangChain + Neo4j でナレッジグラフ構築。Cypherクエリで関連パスを抽出してLLMに渡す。
従来の1件ずつ→一括並列実行。複数ポーズの分布で信頼性を評価。GitHub: gcorso/DiffDock
| 指標 | 結果 |
|---|---|
| 仮説数(提出PPI数) | 有意差あり (p<.05) |
| 信頼スコア | 有意差あり (p<.05) |
| Both-DC vs Either-DC | β=−1.886 (p<.001) |
| Both-DC vs Neither-DC | β=−2.829 (p<.001) |
| 個人差影響 | 最小 (σ²=0.008) |
参加者10名(実務経験7〜18年)。LMER + Tukey HSD検定。
公開実装なし(HCI会議プレプリント)
| 適用先 | ユースケース |
|---|---|
| lib/docking | DiffDockバッチラッパー → 複数候補並列ドッキング |
| lib/docking | KG-RAGスコアを UniDock後段のセカンドフィルタに追加 |
| lib/molgen | KG-RAGスコアをMolgenYamlスコアラーに統合 |
| lib/molgen | Both-DC原則: 多様生成→SAR収束フィルタの2段階設計 |
STRING REST API は無料で即実装可能。KG-RAGの社内文献適用で研究特化スコアを構築できる。