📚 月次論文レビュー — 🤖 機械学習・AI

対象期間: 2026-04-01 〜 2026-04-30このページ: 21〜30 件目各ボタンは独立したトグル（複数同時ON可）

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

21. Uncertainty-Aware Multi-Objective Reinforcement Learning-Guided Diffusion Models for 3D De Novo Molecular Design▶ スライドあり

DOI: null (arXiv:2510.21153) · 📅 2025年10月 · 機械学習・AI

判断:

QED・合成アクセス性（SAS）・結合親和性の3目的を同時最適化する3D de novo分子設計フレームワーク。E(3)-同変Equivariant Diffusion Model（EDM）をバックボーンとし、ChempropのDirected Message Passing Neural Network（D-MPNN）を不確実性推定付きサロゲートモデルとして活用。各特性の閾値超過確率の積として多目的報酬を定義し、PPOスタイルのclipped policy gradientで拡散モデルをファインチューニングする。報酬設計には多様性ペナルティ（Tanimoto）と有効性・新規性・独自性ボーナスが組み込まれており、ペナルティ重みは指数減衰する。

📣 EDM+PPO+不確実性多目的RL：QED・SAS・ドッキング親和性を同時最適化する3D分子設計フレームワーク。QM9/ZINC15/PubChemでSOTA超え、4ns MD+ADMETでEGFR候補として確認。NeurIPS2025採録。arXiv:2510.21153

📊 一枚絵スライド ↗ 別タブ

22. Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs▶ スライドあり

DOI: null (arXiv:2510.23127) · 📅 2025年10月 · 機械学習・AI

判断:

Scientific LLM（Sci-LLM）がバイオ分子シーケンスを処理する際の根本的な問題「トークン化ジレンマ」を体系的に分析し、これを回避する「Context-Driven」パラダイムを提案する論文。従来のアプローチは「シーケンス-as-言語」（Intern-S1・NatureLM）と「シーケンス-as-モダリティ」（Evolla・BioReason）の2つに大別されるが、前者はトークン化が機能モチーフを破壊し、後者はバイオ表現空間とLLM言語空間の意味ギャップ（セマンティックミスアライメント）に苦しむ。

📣 Sci-LLMに生の分子配列を渡すのは逆効果。InterProScan等ツール出力の自然言語コンテキストのみを入力すると大幅性能向上（ARI 0.958 vs 0.492）。SMILESをそのままLLMへ渡す設計の再考を促す知見。arXiv:2510.23127

📊 一枚絵スライド ↗ 別タブ

23. Physics–Preference Aligned Tool-Using Policies for Molecular Design with Gemma-3 270M▶ スライドあり

📅 2025年（NeurIPS 2025 ML4PS Workshop） · 機械学習・AI

判断:

本論文はPhysPrefを提案する。コンパクトなLLM（Gemma-3 270M）を用いた分子設計エージェントで、物理シミュレータ（xTB、AutoDock-Vina、DFT）と連携しながら固定計算バジェット内で高品質分子を設計する。Reporter（シミュレータログ→JSON変換）とPlanner（ツール呼び出し列生成）の2モジュールで構成される。PlannerはDirect Preference Optimization（DPO）により物理スコアと計算コストの両方を考慮した「物理的選好」に整合される。AqSolDB（水溶性）・FreeSolv（水和自由エネルギー）・PCQM4Mv2（HOMO-LUMOギャップ）の3ベンチマークで評価し、同一バジェット下でMolDQNや貪欲プランナーを上回ることを示した。

📣 PhysPref：Gemma-3 270MをDPO整合させた分子設計エージェント。xTB/Vina/DFTをバジェット制御下で選択的に呼び出し、MolDQN比15-25%コスト削減しつつ高品質分子を発見。NeurIPS2025 ML4PSワークショップ採録。

📊 一枚絵スライド ↗ 別タブ

24. Joint Design of Protein Surface and Structure Using a Diffusion Bridge Model▶ スライドあり

DOI: null（arXiv: 2511.16675） · 📅 2025年11月（NeurIPS 2025） · 機械学習・AI

判断:

Hamburg大学（Li, Zhao, Laue）とStanford大学（Wu）の共同研究。タンパク質-ペプチド相互作用（PPI）設計において、受容体表面の幾何学・生化学的情報を明示的に組み込んだ新しいフレームワーク「PepBridge」を提案した。受容体表面の3D点群を入力に、拡散ブリッジモデル（Denoising Diffusion Bridge Model, DDBM）でレセプター表面からリガンド表面を生成し、続いてSE(3)拡散・トーラス拡散・ロジット正規拡散の3種のマルチモーダル拡散でバックボーン・ねじれ角・残基タイプを同時生成する。Shape-Frame Matching Network（SFMNet）が表面形状とバックボーン構造の整合性を反復的に確保する。

📣 受容体表面を拡散ブリッジのpriorとして使い、ペプチドの表面＋バックボーン＋側鎖を同時生成するPepBridgeをNeurIPS2025で発表。RMSD 2.04Å達成。トップダウンPPI設計の新手法。

📊 一枚絵スライド ↗ 別タブ

25. Improving protein-ligand complex generation with force field guidance▶ スライドあり

DOI: null（NeurIPS 2025 Workshop: SimBioChem, OpenReview: https://openreview.net/forum?id=oGywgZ5dR8） · 📅 2025年（NeurIPS 2025 Workshop SimBioChem） · 機械学習・AI

判断:

AstraZenecaとNVIDIAの共同研究。拡散モデル（EDM）やフローマッチング（SemlaFlow）による構造ベース創薬（SBDD）の問題点、すなわち生成リガンドが物理的に非妥当なコンフォーメーションを含む（結合長・角度の異常、タンパク質クラッシュ、高ひずみエネルギー）という点に対処するフレームワークを提案した。MMFF94力場をタンパク質ポケットとのvdW・静電相互作用項で拡張した微分可能なエネルギー関数を構築し、その勾配をサンプリングの各ステップに注入する「エネルギーガイダンス」を実現。既存のモデルを再訓練する必要がなく、推論時のプラグインとして機能する。

📣 SBDD生成モデルの非物理的ポーズ問題をMMFF94力場ガイダンスで解決。再訓練不要の推論時プラグインでSemlaFlowのVina scoreを+3→-5 kcal/mol改善、歪みエネルギー75%削減。TorchMMFF94公開。

📊 一枚絵スライド ↗ 別タブ

26. PLNet: Persistent Laplacian Neural Network for Protein–Protein Binding Free Energy Prediction▶ スライドあり

DOI: 10.1002/pro.70377 · 📅 2025年12月 · 機械学習・AI

判断:

代数的トポロジーの最前線であるパーシステントラプラシアン理論をタンパク質-タンパク質相互作用（PPI）の結合自由エネルギー予測に応用した研究である。University of Florida・Michigan State University・University of Arkansasの共同研究。著者らはPDBbind V2020とSKEMPI v2を統合した新規ベンチマークP2P（6886複合体）を構築し、パーシステントホモロジー特徴量・パーシステントラプラシアンスペクトル・物理化学記述子・ESM言語モデル埋め込みを融合したPLNetで、leave-protein-out交差検証においてPearson R=0.80という有望な結果を達成した。

📣 パーシステントラプラシアン+ESM-2でタンパク質間結合自由エネルギーを予測するPLNet。6886複合体P2PベンチマークでR=0.80。トポロジーが捉える幾何+位相情報が鍵。Protein Sci 2025

📊 一枚絵スライド ↗ 別タブ

27. Modeling Protein–Small Molecule Conformational Ensembles with PLACER▶ スライドあり

DOI: 10.1073/pnas.2427161122 · 📅 2025年11月 · 機械学習・AI

判断:

Baker研究室（University of Washington）が開発した確率的グラフニューラルネットワーク「PLACER（Protein-Ligand Atomistic Conformational Ensemble Resolver）」を提案した研究である。タンパク質バックボーン座標とリガンドの化学グラフ（原子種・結合情報）を入力として、タンパク質サイドチェーンとリガンドの原子座標を確率的に再現するノイズ除去ネットワークである。AlphaFold2/RoseTTAFoldが残基レベルで配列から構造を予測するのとは対照的に、PLACERは原子レベルで「既知の化学構造から座標を生成する」問題として定式化されている。

📣 Baker研究室のPLACER: 確率的GNNでタンパク質-低分子のコンフォメーションアンサンブルを高速生成。CSD+PDB訓練、SE3同変、pRMSD不確実性付き。レトロアルドラーゼ設計でkcat/KM=11000達成。#AI創薬

📊 一枚絵スライド ↗ 別タブ

28. Resolving Data Bias Improves Generalization in Binding Affinity Prediction▶ スライドあり

DOI: 10.1038/s42256-025-01124-5 · 📅 2025年 · 機械学習・AI

判断:

結合親和性予測モデルの「実際の汎化性は報告値より大幅に低い」という問題の根本原因を解明し、その解決策として新しいデータセット分割法（PDBbind CleanSplit）と新規GNNモデル（GEMS）を提案した研究である。ETH Zürich・Zürich University of Applied Sciences・University of Bernの共同研究。結論として、現在のSOTAモデルの高スコアのうち大部分はデータリーク由来であり、リークを除去した環境で真に性能を維持できるモデルはほぼ存在しないことを実証した上で、リーク除去後も競争力を保つGEMSを開発した。

📣 結合親和性予測SOTAのスコアはデータリーク由来だった。CASFの49%が訓練データとリーク。提案のGEMS+CleanSplitでリーク除去後も唯一性能維持。Nat Mach Intell 2025 #AI創薬

📊 一枚絵スライド ↗ 別タブ

29. REINFORCE-ING Chemical Language Models for Drug Discovery▶ スライドあり

DOI: 10.1021/acs.jcim.5c02053 · 📅 2025年11月（Accepted: November 7, 2025） · 機械学習・AI

判断:

化学言語モデル（CLM）と強化学習（RL）を組み合わせた de novo 分子生成において、REINFORCE アルゴリズムの各拡張コンポーネントを体系的に再評価した論文。具体的には Moving Average Baseline（分散削減）、Hill-Climbing（上位 k 割サブサンプリング）、Experience Replay（優先度付きバッファ）、そして新規リワードシェーピング（α/σ 分離制御）の4つの直交的な拡張を MolOpt 23 タスクベンチマークで評価し、最後に Boltz-2 を報酬モデルとしてアロステリック JNK3 リガンドの de novo 設計に適用した。

📣 REINFORCE CLMの各拡張（Hill-Climb・ER・新報酬整形α/σ分離）をMolOpt23タスクで体系評価。統合エージェントがSOTA、Boltz2報酬でJNK3アロステリックリガンド設計も実証。ACEGEN MIT公開。

📊 一枚絵スライド ↗ 別タブ

30. RLMolLM: Reinforcement Learning-Enhanced Language Model Framework for Inverse Molecular Design▶ スライドあり

DOI: 10.1021/acs.jcim.5c02071 · 📅 2025年11月 · 機械学習・AI

判断:

RLMolLMは逆分子設計（目的プロパティを持つ分子を直接生成する）における3つの主要な課題—(1) SMILESの文法的妥当性、(2) 複数プロパティの同時最適化、(3) 構造制約下での生成—を解決するため、事前学習済みBERT型マスク言語モデルにPPO（Proximal Policy Optimization）強化学習と遺伝的アルゴリズム（GA）を統合したフレームワークである。再訓練なしに複数の最適化目標（QED・SA・hERG毒性・Caco-2透過性等）へ高速適応できることが実用上の主な利点である。

📣 BERT masked LM + PPO強化学習 + GAで逆分子設計：QED最大31%改善(0.87)、hERG毒性4.5倍低減。再訓練不要で多プロパティ同時最適化。スキャフォールド制約対応。JCIM 2025

📊 一枚絵スライド ↗ 別タブ

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17