Construction of a Multi-label Odor Prediction Model Based on Molecular Structures and Olfactory Receptor Binding Profiles with a Novel Interpretability Framework
Wakutsu, Kaneko (Meiji University) | Analytical Sciences 2026 | DOI: 10.1007/s44211-026-00900-6
🎯 分子構造と61種の嗅覚受容体(OR)結合プロファイルを統合した3段階MLパイプラインで光学異性体の臭気差異を識別し、受容体レベルの解釈可能性を実現する。
① 背景と課題

ヒトの嗅覚は388種のGPCRである嗅覚受容体への結合パターンに基づくが、従来QSARモデルは分子構造→臭気ラベルの直接マッピングのため光学異性体の臭気差を捉えられなかった。

従来QSAR: 光学異性体の微妙な臭気差を識別不能(l-/d-メントールなど)
GNN/NLPモデル: 精度向上はするが受容体レベルの解釈性なし

→ 「分子→OR結合プロファイル→臭気知覚」という生物学的カスケードをそのままモデル化する

② 手法: 3段階MLパイプライン
3段階パイプライン Model 1 OR結合有無 Model 2 log EC50回帰 Model 3 臭気マルチラベル 入力: 分子構造 + 3Dタンパク記述子 中間: OR応答ベクトル (61次元) 出力: 臭気属性マルチラベル
② 手法: Positive Likeness & ラベル伝播

Positive likeness: 各ORが各臭気ラベルへ与える正の寄与度を定量化する解釈指標。「なぜこの分子がこの臭気に分類されたか」を受容体レベルで説明する。

ラベル伝播: 臭気アノテーション未記載分子への半教師あり外挿予測。「臭気なし」と「未調査」を区別して処理。

61 OR
マウス+ヒト嗅覚受容体(63分子×61受容体の結合データ)
③ 本研究で示したこと(要点)
  • OR結合プロファイルを中間特徴量とした3段階設計でQSAR限界を突破
  • l-/d-メントール等の光学異性体の臭気差を識別(MOR161-2 vs MOR171-16の選択性)
  • Positive likenessにより受容体-臭気属性の寄与を可視化
  • 3Dタンパク記述子導入で前研究から精度改善を達成
④ 主な結果 (a) 光学異性体識別
メントール光学異性体 × OR選択性 l-メントール d-メントール d-メントール MOR 161-2 MOR 171-16 応答あり 応答なし 応答あり
④ 主な結果 (b) モデル精度改善
臭気予測精度(前研究 vs 本研究) 前研究 本研究 基礎記述子 3Dタンパク+ 精度
④ 主な結果 (c) Positive Likeness 解釈例
嗅覚受容体寄与臭気属性Pos. Likeness
MOR161-2Minty/Cool
MOR171-16Camphor
OR52A1Floral
OR2W1Musk

各受容体の主寄与臭気が生物学的既知機能と一致

④ 主な結果 (d) データ規模と外挿
63分子
×61受容体の結合実験データ(log EC50)
388種
ヒト嗅覚受容体(全OR、うち61種を本研究でカバー)
Label Prop.
未アノテーション分子への半教師あり外挿
⑤ テイクホームメッセージ
生物学的カスケードをそのままモデル化
OR結合プロファイルを中間表現に使うことで光学異性体識別が可能になった
Positive likenessで「なぜ」が分かる
受容体-臭気ラベル寄与の可視化は新薬のOff-target嗅覚リスク評価に応用できる
lib/docking GPCR選択性予測への一般化
同じ3段階設計をドーパミン/βAR受容体サブタイプ選択性スコアラーとして実装可能
lib/molgen への統合
目標臭気プロファイルをMPOスコアラーに組み込み、香料分子の自動生成が構築できる
本手法 vs 従来手法
手法光学異性体識別解釈性外挿
QSAR (FP)
GNN
本手法(3段階)
本研究のインパクト
  • OR結合プロファイルをlib/dockingのGPCR選択性予測スコアラーとして実装可能
  • MolgenYamlの臭気属性スコアラー追加で香料・フレーバー分子生成を実現
  • 光学異性体の臭気差識別は微細な立体化学依存性の有用なベンチマーク事例