📚 週次論文レビュー — 🤖 機械学習・AI

対象期間: 2026-04-20 〜 2026-04-26 このページ: 31〜40件目 各ボタンは独立したトグル（複数同時ON可）

ページ: 1 2 3 4 5 6 7 8

31. RxnBench: A Multimodal Benchmark for Evaluating Large Language Models on Chemical Reaction Understanding from Scientific Literature

DOI: null (arXiv:2512.23565) · 📅 2025年12月 · 機械学習・AI

判断:

RxnBenchは、MLLMが科学論文に掲載された化学反応を理解する能力を厳密に評価するための多段階マルチモーダルベンチマークである。Single-Figure QA（SF-QA）とFull-Document QA（FD-QA）の2層構成で、反応スキーム画像の知覚から論文全文横断推論まで幅広い能力を測定する。DP Technology（DeepMind China部門相当）・上海交通大・清華大などの研究者によって構築された。

📣 RxnBench：41 MLLMを化学反応スキーム理解で評価。SF-QAはGemini-3-Flash 96%、FD-QA全文推論は全モデル50%未満。Structure認識が共通弱点。文献→SMILES自動抽出への応用に期待。#ケムインフォマティクス

📊 一枚絵スライド ↗ 別タブ

32. MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics

DOI: null (arXiv:2601.02075) · 📅 2026年1月 · 機械学習・AI

判断:

MDAgent2は、LAMMPS（Large-scale Atomic/Molecular Massively Parallel Simulator）向けのコード生成と知識Q&Aを統合的に扱う初のエンドツーエンドLLMフレームワークである。Qwen3-8Bをバックボーンとして、CPT（継続事前学習）→SFT（教師あり微調整）→MD-GRPO（実行フィードバック付きRL）の3段階訓練で2種の専門モデルを構築する。加えて、コード生成→実行→評価→自己修正の全自動ループを実現するMDAgent2-RUNTIMEと、初のLAMMPSコード生成＆QA統合ベンチマーク「MD-EvalBench」を提供する。実装はGitHub（https://g…

📣 MDAgent2：LAMMPS特化の3段階LLM訓練（CPT+SFT+MD-GRPO）。実行フィードバックRLでExecSucc@3を14%→38%に向上。マルチエージェント自己修正ループ付き。GROMACS自動セットアップへの応用期待。#ケムインフォマティクス

📊 一枚絵スライド ↗ 別タブ

33. MolAct: An Agentic RL Framework for Molecular Editing and Property Optimization

DOI: null (arXiv:2512.20135) · 📅 2025年12月 · 機械学習・AI

判断:

MolActは、分子編集（官能基の追加・削除・置換）と分子プロパティ最適化（LogP、溶解度、QED、DRD2、JNK3、GSK-3β）を「マルチターン・ツール拡張型の逐次意思決定問題」として統一的に定式化したAgentic RLフレームワークである。LLMバックボーン（Qwen-2.5-3B/7B）がRDKitベースの化学ツールを呼び出しながらSMILES文字列を反復改変し、Group Relative Policy Optimization（GRPO）によって報酬信号から方策を学習する。実装はGitHub（https://github.com/little1d/MolAct）とHuggingFace（https://huggin…

📣 MolAct：LLMエージェントがRDKitツールを多ターン呼び出しながら分子編集→最適化を学ぶAgentic RLフレーム。7BモデルのLogP最適化SR 92%、Claude 3.7超え。2段階カリキュラムが鍵。#ケムインフォマティクス

📊 一枚絵スライド ↗ 別タブ

34. HalluMat: Detecting Hallucinations in LLM-Generated Materials Science Content Through Multi-Stage Verification

DOI: null (arXiv:2512.22396) · 📅 2025年12月 · 機械学習・AI

判断:

ミズーリ大学のChengグループが提案したHalluMatは、材料科学ドメインに特化したLLMハルシネーション検出フレームワーク（HalluMatDetector）とそれを評価するベンチマークデータセット（HalluMatData）からなる研究。LLaMA-2で生成した材料科学回答3269件をLow/Medium/Highの3段階に分類したHalluMatDataを構築し、内因性評価（自己整合性チェック・信頼度分散解析・エントロピー不確実性定量化・矛盾グラフ解析）を主軸にFAISS+BM25+NLIによる外因性RAGをフォールバックとするHalluMatDetectorを提案した。ハルシネーション率を標準LLM比30%削減し、言い換…

📣 HalluMat：材料科学LLMハルシネーションを30%削減。内因性評価（自己整合性+エントロピー+矛盾グラフ）主軸でRAGをフォールバックとする4段階検証とPHCS指標を提案。創薬AIの信頼性評価に応用できる重要な手法。 #MaterialsScience

📊 一枚絵スライド ↗ 別タブ

35. FRAGMENTA: End-to-end Fragmentation-based Generative Model with Agentic Tuning for Drug Lead Optimization

DOI: null (arXiv:2511.20510) · 📅 2025年11月 · 機械学習・AI

判断:

コロラド大学デンバー校（CS）とアンシュッツ医療キャンパス（薬学部）の共同研究によるFRAGMENTAは、二つのコアコンポーネントを組み合わせたend-to-end創薬リード最適化フレームワーク。第一のコンポーネントはLVSEF（Learning Vocabulary Selection for Expressive Fragmentation）で、分子フラグメントの選択を「語彙選択問題」として定式化しQ学習でエンドツーエンドに最適化する。第二のコンポーネントは5エージェント構成のマルチエージェントチューニングシステムで、薬剤師のフィードバックを自動解釈・構造化してモデルの目的関数を自律的に更新する。実際の癌創薬ラボ（104化合物の…

📣 FRAGMENTA：Q学習でフラグメント選択×生成をend-to-end最適化。5エージェントで薬剤師フィードバックを自動モデル更新に変換。実癌創薬ラボ7ヶ月展開でドッキングヒット2倍。lib/molgenへの統合候補。 #DrugDiscovery

📊 一枚絵スライド ↗ 別タブ

36. AGAPI-Agents: An Open-Access Agentic AI Platform for Accelerated Materials Design on AtomGPT.Org

DOI: null (arXiv:2512.11935) · 📅 2025年12月 · 機械学習・AI

判断:

ジョンズ・ホプキンス大学のChoudharyグループが開発したAGAPI（AtomGPT.org API）は、8種以上のオープンソースLLMと20以上の材料科学APIエンドポイントを統合したオープンアクセスのアジェンティックAIプラットフォーム。JARVIS-DFT・Materials Project・AFLOW・OQMDなどの材料データベースと、ALIGNN（物性予測）・ALIGNN-FF（力場）・SlaKoNet（バンド構造計算）・DiffractGPT（XRD解析）・ESMFold（タンパク質構造予測）などの計算ツールを、Agent-Planner-Executor-Summarizer（APES）パイプラインで統合する。商用…

📣 AGAPI：OSSモデル8種+材料科学API20以上を統合した自律AIプラットフォーム。自然言語→10ステップMD/XRD/バンド計算を自動実行。1000ユーザー実証済み。創薬パイプラインのAPES化に応用価値あり。 #ChemInformatics

📊 一枚絵スライド ↗ 別タブ

37. SCP: Accelerating Discovery with a Global Web of Autonomous Scientific Agents

DOI: null (arXiv:2512.24189) · 📅 2025年12月 · 機械学習・AI

判断:

上海AI研究所（Shanghai Artificial Intelligence Laboratory）が提案したScience Context Protocol（SCP）は、自律科学AIエージェントのためのオープン標準プロトコルである。既存のModel Context Protocol（MCP）が「単一ツールの呼び出し」に留まるのに対し、SCPは科学実験のライフサイクル全体（登録→計画→実行→監視→アーカイブ）をHub-and-Spoke型アーキテクチャで管理する。1600以上のツールリソースを1つのエコシステムに統合した実証プラットフォームとして実装されており、計算（ドライ）と実験室（ウェット）の両リソースを同一プロトコルで扱え…

📣 SCP：AIエージェント向け科学実験プロトコル。MCPを拡張し実験ライフサイクル管理・機関間認証・ドライ-ウェット統合を実現。1600+ツール対応。創薬パイプラインのSCPサーバー化で外部連携が標準化できる。 #ChemInformatics

📊 一枚絵スライド ↗ 別タブ

38. Understanding Structural Representation in Foundation Models for Polymers

DOI: null (arXiv:2512.11881) · 📅 2025年12月 · 機械学習・AI

判断:

IBMリサーチが提案した、ポリマー専用基盤モデル（SMI-TED-POLYMER289M）とその基盤となるCMDL Polymer Graph（CPG）表現の研究。ポリマーMLの慢性的課題である「SMILESではランダムコポリマーとブロックコポリマーを区別できない」「データセットが散在し標準ベンチマークがない」に対し、SMILES文法を最小限拡張したCPG表現を提案し、28の公開ベンチマークで評価した。同時に系統的なコントロール実験により、ポリマー基盤モデルが表現形式に対して意外なほど不変性（invariance）を持つことを明らかにした。

📣 IBM発ポリマー基盤モデル。SMILES拡張のCPG表現で28ベンチマーク中多数SOTA。重要な知見：モデルは表現の化学的意味より配列分布を内挿する「表現不変性」を持つ。ポリマー設計の常識を問い直す論文。 #ChemInformatics

📊 一枚絵スライド ↗ 別タブ

39. Learning to Make Decisions for Autonomous Drug Design

DOI: 10.63959/chalmers.dt/5792 · 📅 2025年（Chalmers 工科大学 + ヨーテボリ大学博士論文） · 機械学習・AI

判断:

創薬における自律的意思決定（autonomous decision-making）を中心テーマとした博士論文。de novo 薬物設計の DMTA（Design-Make-Test-Analyze）サイクルにおけるデータ効率的な意思決定問題を、強化学習・能動学習・多腕バンディットの視点から体系的に研究した5本の論文を統合している。主要な貢献は（1）反応収率予測の能動学習、（2）MAB による分子選択最適化、（3）RL アルゴリズムの体系的比較、（4）多様性対応 RL 報酬設計、（5）DPP ミニバッチ選択の5点であり、いずれも実際の創薬パイプラインに組み込み可能な実装志向の研究である。

📣 Chalmers博士論文2025。DMTA分子選択へのMAB・DPP多様ミニバッチ・多様性対応RL報酬など5研究を統合。JobManager+MolgenYamlに直接実装可能な実践的手法群。創薬RL探索効率化の教科書に。

📊 一枚絵スライド ↗ 別タブ

40. Deep contrastive learning enables genome-wide virtual screening

DOI: 10.1126/science.ads9530 · 📅 2026年1月8日 · 機械学習・AI

判断:

清華大学のグループが開発した DrugCLIP は、タンパク質ポケットと低分子を共通の潜在空間に対照学習（Contrastive Learning）で埋め込み、コサイン類似度でランキングするバーチャルスクリーニングフレームワークである。従来のドッキング（1ペアあたり数秒〜分）に対し、分子ベクトルのオフライン計算と FAISS 近似最近傍探索を組み合わせることで、同精度またはそれ以上の性能を保ちながら **1,000 万倍以上の高速化** を実現した。8 GPU で 10 兆タンパク質-リガンドペアを 24 時間以内にスコアリングし、~10,000 ヒトタンパク質 × 500M 化合物のゲノムワイドスクリーニングを完遂して「Genom…

📣 DrugCLIPが対照学習で従来ドッキングの1000万倍高速なVSを実現。8GPUで10兆ペアを24時間でスクリーニング。ゲノムワイドのGenomeScreenDB公開済み。TRIP12など未知標的でも17.5%ヒット率を達成。

📊 一枚絵スライド ↗ 別タブ

ページ: 1 2 3 4 5 6 7 8