📚 月次論文レビュー — 🤖 機械学習・AI

対象期間: 2026-04-01 〜 2026-04-30このページ: 161〜165 件目各ボタンは独立したトグル（複数同時ON可）

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

161. Molecular Deep Learning at the Edge of Chemical Space▶ スライドあり

DOI: 10.1038/s42256-026-01216-w · 📅 2026年3月（オンライン先行公開） · 機械学習・AI

判断:

機械学習モデルは、トレーニングデータの化学空間内では高い予測精度を発揮するが、構造的に新規な分子（Out-of-Distribution, OOD）に対しては信頼性が著しく低下する。この問題はドラッグディスカバリーにおいて深刻で、十億規模の化合物ライブラリをスクリーニングする際に多数の誤予測が生じる原因となる。本論文では、Joint Molecular Modelling（JMM）と名付けた半教師あきオートエンコーダを提案し、分子特性予測と分子再構成を同時に最適化することで「unfamiliarity（非馴染み度）」という新指標を導入する。この指標はモデルが特定の分子をどれだけ「知っているか」を定量化し、予測信頼性の代理指標として機能する。

📣 オートエンコーダの再構成損失を「非馴染み度」指標に転用し、化学空間の外縁でのML予測信頼性を定量化。33データセットで実証、キナーゼ2標的のwet lab検証で7ヒットを発見。#DrugDiscovery #MachineLearning

📊 一枚絵スライド ↗ 別タブ

162. ATMOS: Autoregressive Trajectory Model for Open-ended Simulation▶ スライドあり

DOI: null（arXiv:2603.17633） · 📅 2026年3月（arXiv） · 機械学習・AI

判断:

MDシミュレーションの深層学習加速において、「生成モデルが長時間の因果的・連続的軌道を生成できるか」という課題は未解決のままだった。既存の拡散/フローマッチングベースの軌道モデル（MDGen、DeepJump等）は時間方向の因果依存性を明示的に保持せず、自己回帰的な長時間生成では誤差が蓄積しやすい。PKU/BioGeometry/MilaのShi/Tang et al.は **ATMOS（Autoregressive Trajectory Model for Open-ended Simulation）** を提案した。状態空間モデル（SSM）をバックボーンとした自己回帰アーキテクチャで、タンパク質単量体とタンパク質-リガンド複合体の**双方**を統一的に扱える初めての汎用MDサロゲートモデルである。

📣 ATMOS：SSM+Pairformer自己回帰モデルでタンパク質単量体・リガンド複合体両対応の汎用MDサロゲート。キーフレーム生成＋アンカー条件付き補間の二段階設計。ATLAS・MISATO双方で検証。arXiv 2026

📊 一枚絵スライド ↗ 別タブ

163. BioMD: All-atom Generative Model for Biomolecular Dynamics Simulation▶ スライドあり

DOI: null（arXiv:2509.02642） · 📅 2025年9月2日（arXiv） · 機械学習・AI

判断:

分子動力学（MD）シミュレーションは創薬の計算化学において中心的な役割を担うが、非共有相互作用力の計算コストが律速となり、生物学的に意義のある長時間スケールへのアクセスが困難だった。深層学習によるMD加速は有望だが、既存手法の多くはタンパク質の内部座標（二面角など）やコースグレイン表現を使用しており、リガンドとの全原子相互作用を直接モデル化できなかった。IDEA研究院（深圳）のFeng/Li et al.はこの問題を **BioMD** で解決した。全原子デカルト座標を直接扱う初の生成型タンパク質-リガンドダイナミクスモデルであり、SE(3)グラフトランスフォーマーとFlowTrajectoryTransformerを組み合わせた階層的生成フレームワークで長時間軌道を効率的に生成する。リガンド解離経路の97.

📣 BioMD：初の全原子タンパク質-リガンドMD生成モデル。SE(3) GT+FlowTrajectoryTransformerの階層生成でリガンド解離97.1%成功。MISATO SOTA。創薬のMD加速に直結。arXiv Sep 2025

📊 一枚絵スライド ↗ 別タブ

164. Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics▶ スライドあり

DOI: null（arXiv preprint, arXiv:2602.02128） · 📅 2026年2月11日（arXiv） · 機械学習・AI

判断:

古典的MDシミュレーションはタンパク質の機能に関わるダイナミクスをマイクロ秒〜ミリ秒スケールで再現するために膨大な計算資源を必要とする。深層生成モデルによるMD加速は有望だが、既存手法はアーキテクチャ上の制約・誤差蓄積・時空間依存性の不十分なモデル化により長時間生成に失敗することが多い。ByteDance SeedのShoghi/Gu et al.はこの課題に対して **STAR-MD**（Spatio-Temporal Autoregressive Rollout for Molecular Dynamics）を提案した。

📣 STAR-MD：関節時空間SE(3)拡散でマイクロ秒タンパク質軌道を安定生成。ATLAS全指標SOTA・1μsでベースライン手法が破綻する中も高品質維持。KVキャッシュ＋コンテキストノイズが鍵。arXiv 2026

📊 一枚絵スライド ↗ 別タブ

165. BIOPTIC B1 Ultra-High-Throughput Virtual Screening System Discovers LRRK2 Ligands in Vast Chemical Space▶ スライドあり

DOI: 10.1021/acs.jcim.5c00743 · 📅 2025年（J. Chem. Inf. Model., accepted 2025） · 機械学習・AI

判断:

EnamineREAL Spaceのような40〜70億規模の化合物ライブラリを対象とした仮想スクリーニングでは、ドッキングや機械学習モデルの推論コストが律速になる。Vinogradov et al.（Optic Inc.）は、この問題を**レコメンデーションシステム的発想**で解決するLBVSシステム **BIOPTIC B1** を発表した。RoBERTa型トランスフォーマーモデルで分子を60次元の埋め込みベクトルに変換し、あらかじめ全ライブラリの埋め込みをSSD上にインデックス化しておくことで、クエリ化合物との類似度検索を約2分で完了する。EnamineREAL 40億化合物に適用してLRRK2（パーキンソン病関連キナーゼ）の新規リガンドKd=110 nMを発見し、全体ヒット率10.4%を達成した。

📣 BIOPTIC B1：RoBERTa transformer（8.7Mパラメータ）+60次元埋め込みコサイン検索で40億化合物を約2分でスクリーニング。LRRK2でKd=110 nMのヒット、ヒット率10.4%達成。JCIM 2025

📊 一枚絵スライド ↗ 別タブ

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17