📚 月次論文レビュー — 🤖 機械学習・AI 対象期間: 2026-04-01 〜 2026-04-30 このページ: 41〜50 件目 各ボタンは独立したトグル(複数同時ON可)
41. SeedFold: Scaling Biomolecular Structure Prediction▶ スライドあり
DOI: null (arXiv:2412.10743) · 📅 2025年12月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
SeedFoldはByteDance Seedが開発した生体分子構造予測モデルであり、AlphaFold3系アーキテクチャの「スケーリングレシピ」を体系的に探究した研究である。「モデルをどう大きくすれば性能が向上するか」という問いに対し、幅スケーリング・深さスケーリング・構造モジュール深さの3軸を比較し、Pairformerの隠れ次元(幅)を拡大することが最も効率的であることを実験的に示した。同時に、三角アテンションの計算ボトルネックを解消するLinear Triangular Attention、および知識蒸留による26.5M規模の訓練データ構築という2つの技術的貢献を組み合わせ、FoldBenchベンチマークにおいてAlphaFold3を多数のタスクで上回る性能を達成した。
📣 ByteDance製SeedFold、AlphaFold3超え🧬 Pairformer「幅スケーリング」が鍵。Linear三角アテンションでメモリO(n²d)削減+2650万件蒸留データ。タンパク-リガンドSR 66.5%で最高性能 #構造予測 #CreukDrug
42. Apo2Mol: 3D Molecule Generation via Dynamic Pocket-Aware Diffusion Models▶ スライドあり
DOI: null (arXiv:2511.14559) · 📅 2025年11月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
Apo2Molは、apoタンパク質構造(リガンド非結合状態)を入力として3Dリガンド分子とホロポケットコンフォメーションを同時生成する全原子SE(3)-等変拡散モデルである。既存のSBDDモデルが実験的に解明されたホロ(リガンド結合)構造を前提とするのに対し、本研究はタンパク質の誘導適合(conformational change upon ligand binding)を明示的にモデル化することで、apoのみ利用可能なターゲットへの対応を可能にする。PLINDERデータベースから厳格にフィルタリングした24,601件のapo-holo-ligandトリプレットで訓練し、apoポケット入力でVina min avg -7.86という優れた結合親和性を達成した。
📣 apoタンパク質構造からリガンドとホロポケットを同時生成するApo2Mol。Vina min -7.86でSOTA(holo入力IPDiff -7.09超)。PLINDER由来24,601件データセット構築。コード公開。arXiv:2511.14559
43. SculptDrug: A Spatial Condition-Aware Bayesian Flow Model for Structure-based Drug Design▶ スライドあり
DOI: null (arXiv:2511.12489) · 📅 2025年11月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
SculptDrugは、Bayesian Flow Networks(BFN)を基盤とした空間条件認識型SBDD(Structure-Based Drug Design)生成モデルである。タンパク質-リガンド結合に特有の空間的制約を忠実にモデル化するため、タンパク質表面制約を取り込むBoundary Awareness Block(BAB)と、グローバルからローカルへの階層的タンパク質エンコーダを導入する。CrossDocked2020データセットで評価し、Vina Score・IMP%・QED・SAのすべてにおいて既存SOTAを上回る結果を達成した。
📣 BFN+表面制約BAB+k-means++階層エンコーダでSBDD全SOTA超えのSculptDrug。Vina Score -6.94、MPBG+7.95%(唯一ポジティブ)。コード公開。arXiv:2511.12489
44. ReACT-Drug: Reaction-Template Guided Reinforcement Learning for de novo Drug Design▶ スライドあり
DOI: null (arXiv:2512.20958) · 📅 2025年12月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
ReACT-Drugは、ESM-2タンパク質言語モデル・ChemBERTa分子エンコーダ・ChEMBL由来反応テンプレートを統合したPPO(Proximal Policy Optimization)ベースの強化学習ドラッグデザインフレームワークである。特定ターゲットへの事前訓練なしに(ターゲット非依存型)、ESM-2埋め込みによる類似タンパク質検索でフラグメントプールを初期化し、反応テンプレートガイドの動的アクション空間で100%化学的有効性を保証しながら多目標最適化(結合親和性・drug-likeness・新規性)を行う。6つの多様なタンパク質ターゲット(セロトニン受容体・ムスカリン受容体・キナーゼ・ドーパミン受容体・オピオイド受容体)で評価し、100%有効性・100%新規性(MOSES準拠)を達成した。
📣 反応テンプレートガイドPPO+ESM-2+ChemBERTaによるターゲット非依存創薬。6ターゲットで有効性・新規性100%達成、KOR候補-11.3 kcal/mol。コード公開。arXiv:2512.20958
45. MolGuidance: Advanced Guidance Strategies for Conditional Molecular Generation with Flow Matching▶ スライドあり
DOI: null (arXiv:2512.12198) · 📅 2025年12月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
MolGuidanceは、SE(3)-等変フローマッチング分子生成フレームワーク(PropMolFlow)にCFG(Classifier-Free Guidance)・オートガイダンス(AG)・モデルガイダンス(MG)の3種の先進的ガイダンス手法を統合し、条件付きde novo分子生成におけるプロパティアライメントを向上させる研究である。3D分子は原子座標(連続変数)と原子タイプ・電荷・結合次数(離散変数)を持つため、それぞれに独立なガイダンスを設計し、Bayesian最適化でガイダンススケールを共同最適化するハイブリッド戦略を提案する。QM9(5元素)とQMe14S(14元素)で評価し、プロパティアライメントのSOTAを達成する。
📣 フローマッチング分子生成にCFG/AG/MGの3種ガイダンスを体系比較。連続+離散ハイブリッドがSOTA。AGが4次元バランス最良。離散ガイダンスはlog確率補間が安定。arXiv:2512.12198
46. Peptide2Mol: A Diffusion Model for Generating Small Molecules as Peptide Mimics for Targeted Protein Binding▶ スライドあり
DOI: null (arXiv:2511.04984) · 📅 2025年11月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
Peptide2Molは、タンパク質ポケットへのペプチドバインダーを参照しながら小分子を生成する構造ベース創薬(SBDD)向け拡散モデルである。従来のSBDDモデルがタンパク質-低分子複合体データのみを学習するのに対し、本モデルはペプチド-タンパク質相互作用の構造情報を明示的に取り込み、ペプチドのバインディング界面を模倣した小分子(ペプチドミメティクス)を生成できる。E(3)-等変グラフニューラルネットワークをバックボーンとした非自己回帰拡散モデルであり、分子座標・原子タイプ・結合タイプを同時に生成する。
📣 ペプチドバインダー構造を参照して小分子を生成するE(3)等変拡散モデルPeptide2Mol。固定原子バリアントでPoseBusters通過率83.8%を達成。ペプチド→低分子変換の系統的枠組みを初めて提案。arXiv:2511.04984
47. Diffusion Models are Molecular Dynamics Simulators▶ スライドあり
DOI: null (arXiv:2511.17741) · 📅 2025年11月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
本論文は、逆時間拡散サンプラーに「調和アダプター」(harmonic adapter:隣接する逆時間イテレート間の二次カップリング)を追加することで、各逆拡散ステップが数学的に正確な意味で過減衰Langevinダイナミクスのオイラー・丸山(EM)積分ステップと等価になることを証明する。バーゼル大学の薬学科によるこの理論研究は、拡散モデルとMDシミュレーションの間に代数的な恒等式を確立し、force field不要のデータ駆動型MDフレームワークへの道を開く。
📣 拡散モデルの逆ステップ+調和アダプター=EM積分器であることを証明。Force field不要で学習済みスコアモデルからMDトラジェクトリを生成。コスト100〜1000倍削減の可能性。lib/md高速化に直結。#ケムインフォマティクス
48. MolSculpt: Sculpting 3D Molecular Geometries from Chemical Syntax▶ スライドあり
DOI: null (arXiv:2512.10991) · 📅 2025年12月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
MolSculptは、SELFIES(Self-Referencing Embedded Strings)という化学的構文表現に内包された豊かな化学知識を活用して、高精度な3D分子幾何を生成するクロスモーダル分子生成フレームワークである。凍結された1D分子基盤モデル(MoLLaMA、960M、1.8B分子で事前訓練)からlearnableクエリで化学知識を蒸留し、Qwen2.5エンコーダベースのプロジェクタを通じて3D拡散モデルの条件空間に転写する。コードはGitHubで公開されている(https://github.com/SakuraTroyChen/MolSculpt)。
📣 MolSculpt:凍結MoLLaMAからlearnableクエリで化学知識を抽出→3D拡散モデルをガイド。GEOM-DRUGSでFCD3D SOTA、条件付き生成でNExT-Mol比MAE最大75%削減。lib/molgen統合候補。#ケムインフォマティクス
49. RxnBench: A Multimodal Benchmark for Evaluating Large Language Models on Chemical Reaction Understanding from Scientific Literature▶ スライドあり
DOI: null (arXiv:2512.23565) · 📅 2025年12月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
RxnBenchは、MLLMが科学論文に掲載された化学反応を理解する能力を厳密に評価するための多段階マルチモーダルベンチマークである。Single-Figure QA(SF-QA)とFull-Document QA(FD-QA)の2層構成で、反応スキーム画像の知覚から論文全文横断推論まで幅広い能力を測定する。DP Technology(DeepMind China部門相当)・上海交通大・清華大などの研究者によって構築された。
📣 RxnBench:41 MLLMを化学反応スキーム理解で評価。SF-QAはGemini-3-Flash 96%、FD-QA全文推論は全モデル50%未満。Structure認識が共通弱点。文献→SMILES自動抽出への応用に期待。#ケムインフォマティクス
50. MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics▶ スライドあり
DOI: null (arXiv:2601.02075) · 📅 2026年1月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
MDAgent2は、LAMMPS(Large-scale Atomic/Molecular Massively Parallel Simulator)向けのコード生成と知識Q&Aを統合的に扱う初のエンドツーエンドLLMフレームワークである。Qwen3-8Bをバックボーンとして、CPT(継続事前学習)→SFT(教師あり微調整)→MD-GRPO(実行フィードバック付きRL)の3段階訓練で2種の専門モデルを構築する。加えて、コード生成→実行→評価→自己修正の全自動ループを実現するMDAgent2-RUNTIMEと、初のLAMMPSコード生成&QA統合ベンチマーク「MD-EvalBench」を提供する。実装はGitHub(https://github.
📣 MDAgent2:LAMMPS特化の3段階LLM訓練(CPT+SFT+MD-GRPO)。実行フィードバックRLでExecSucc@3を14%→38%に向上。マルチエージェント自己修正ループ付き。GROMACS自動セットアップへの応用期待。#ケムインフォマティクス