DeepMIF: Multiview Interactive Fusion for RNA-Small Molecule Binding Affinity Prediction

DeepMIF: A Multiview Interactive Fusion-Based Deep Learning Method for RNA-Small Molecule Binding Affinity Prediction

J. Chem. Inf. Model. 2026, 66, 3575-3589 | DOI: 10.1021/acs.jcim.5c02946 | Category: Machine Learning

RNA標的創薬の鍵：L-ESKmer＋RNA言語モデル＋GNNをクロスアテンションで融合し、PCC 0.796でRNA-低分子親和性を予測。コールドRNA/コールド低分子でも既存超え。

① 背景：RNA標的創薬の予測手法の未成熟さ

RNA標的創薬は遺伝病や感染症などタンパク質標的が困難な疾患への新規アプローチとして注目されているが、結合親和性予測の体系的な計算手法はタンパク質標的に比べて大きく遅れている。学習データ規模も大差があり、PDBbindの数万件に対してRNA-低分子データセットは1000件強に留まる。

既存k-mer表現は位置情報を無視し、RNA二次構造由来の局所モチーフを捉えきれない

RNA-低分子間の双方向相互作用が独立学習的で、特徴融合が不十分

→ 局所コンテキスト保持＋クロスアテンション融合で、限られたデータでも高精度を引き出すモデルを設計

② 手法：4要素のマルチビュー融合アーキテクチャ

③ 本研究で示したこと

④-a 全体性能：PCC / RMSE

0.796 PCC（5-fold CV平均）

④-b コールドスタート評価の優位

学習に含まれないRNA / 学習に含まれない低分子双方で既存手法より高い相関を維持。新規RNA標的・新規ライブラリへの外挿適性を示唆。

④-c マルチビュー寄与の分解

L-ESKmerとRNA-LMの併用が単独使用より一貫して上回り、両者が捉える情報が異なることを示す。

④-d クロスアテンションの解釈

⑤ テイクホームメッセージ

RNA表現は二刀流が効く
L-ESKmerの局所構造シグナルとRNA-LMの大域進化文脈を併用することで、限られた1439ペアでもPCC 0.796という実用域に届く。

クロスアテンションが融合の本質
RNA側と低分子側を独立に潰さず、双方向の重み付けで相互作用特徴を保持する設計が、コールド条件での外挿性能の鍵となった。

外挿性＝VS適性
未知RNA・未知化合物のいずれでも既存手法を上回る挙動は、RNA標的の事前選抜やヒット拡張にそのまま応用できる。

RNA創薬基盤化への前哨
3D構造や非コードRNAクラスはまだ未対応。配列駆動のスクリーニング層として位置づけ、構造ベース手法と直列で組み合わせるべき。

RNA標的パイプラインへの応用

lib/docking: UniDockRunner の RNA-低分子ドッキング後段に DeepMIF をリスコアラとして組込み、物理スコア＋ML親和性のハイブリッド順位付け
lib/molgen: MolgenYaml のスコアラに登録し、RNA選択性を誘導する化合物生成
共通基盤: PDB/mmCIF からの RNA 配列抽出 → L-ESKmer / RNA-LM 埋め込み計算を標準化し、RNA-protein 二系統対応に拡張

インパクト