📚 月次論文レビュー — 🤖 機械学習・AI 対象期間: 2026-04-01 〜 2026-04-30 このページ: 11〜20 件目 各ボタンは独立したトグル(複数同時ON可)
11. SHARP: Generating Synthesizable Molecules via Fragment-Based Hierarchical Action-Space Reinforcement Learning for Pareto Optimization▶ スライドあり
DOI: 10.1021/acs.jcim.5c01699 · 📅 2025年10月(J. Chem. Inf. Model. 2025, 65, 11601–11619) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
SHARPは、合成可能性・結合親和性・薬物様性の三目的をParetoフロント上で同時最適化するフラグメントベースの強化学習(RL)分子生成フレームワークである。既存の深層生成モデルが「分布モデリング」に留まり直接的な最適化フィードバックを持たない点と、原子レベルの自己回帰生成が合成可能性を保証しにくい点という2つの根本的課題に対応する。解決策として、ChEMBL34のBRICS分解から構築したフラグメントライブラリ上での2段階階層的アクション空間(操作種別選択 + フラグメント選択)と、事前学習済み合成可能性推定モデル(SEM)によるリアルタイムアクションマスクを導入している。
📣 SHARP: BRICSフラグメントベースの階層RLで合成可能性・結合親和性を同時Pareto最適化。Vina score -8.5でPocket2Mol比+32%。専門家評価で15中12化合物が合成可能。 #創薬AI #分子設計
12. VeGA: A Versatile Generative Architecture for Bioactive Molecules across Multiple Therapeutic Targets▶ スライドあり
DOI: 10.1021/acs.jcim.5c01606 · 📅 2025年10月(J. Chem. Inf. Model. 2025, 65, 10918–10931) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
VeGAは、de novo分子設計のための軽量なdecoder-only Transformerモデルである。計算資源が限られた環境でも動作する「コンパクトかつ高性能な汎用ジェネレータ」というコンセプトのもと設計されており、約80万パラメータという極めて少ないパラメータ数でSOTA並みの生成性能を実現する。ChEMBL(109万化合物)での事前学習後、少量のターゲット特異的データ(77〜882化合物)でfine-tuningすることで、複数の創薬ターゲットに対応できる汎用性を持つ。FXR(ファルネソイドX受容体)への応用ではGLIDEドッキングによる結合ポテンシャル検証まで実施し、実用的な創薬ワークフローへの統合可能性を示している。
📣 VeGA: 0.8Mパラメータの軽量Transformer分子ジェネレータ。MOSESで有効率96.6%・新規性93.6%、スキャフォールド多様性はS4・R4超え。77化合物のlow-dataでも機能。実装公開済み。 #創薬AI
13. Combining GCN Structural Learning with LLM Chemical Knowledge for Enhanced Virtual Screening▶ スライドあり
DOI: 10.1021/acs.jcim.5c00950 · 📅 2025年10月(J. Chem. Inf. Model. 2025, 65, 11510–11520) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
仮想スクリーニングにおける分子活性分類のため、グラフ畳み込みネットワーク(GCN)とChemBERTaによるSMILS埋め込みを融合したハイブリッドモデルGCN-LLMを提案する研究である。GCNは分子グラフの局所的な構造・トポロジー情報(原子結合・芳香族性・キラリティ等)を学習する一方、ChemBERTaは数百万分子での事前学習により獲得したグローバルな化学文脈知識(官能基間相互作用・長距離依存性等)を提供する。両者を統合することで、いずれか単独では捉えられない分子特性を総合的に予測できる。
📣 GCN-LLM仮想スクリーニング:ChemBERTa埋め込みを各GCN層に逐次注入する層ごと融合で精度88.7%・AUC-ROC 91.7%。軽量34K paramsで8データセット全SOTA。実装公開済み。 #創薬AI #ケモインフォ
14. ChemFM as a scaling law guided foundation model pre-trained on informative chemicals▶ スライドあり
DOI: 10.1038/s42004-025-01793-8 · 📅 2025年11月(Communications Chemistry, Article in Press) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
ChemFMは、スケーリング則の解析を通じて設計された30億パラメータ(ChemFM-3B)の化学基盤モデルである。タスク固有のAIモデルが抱える2つの根本的な問題、すなわち(1)モデルサイズのスケーラビリティの欠如と(2)異なるタスク間の汎化能力の欠如に対応するために構築された。UniChemデータベースから取得した1.78億分子を自己回帰的因果言語モデリングで学習し、汎用的な分子表現を獲得する。fine-tuningはLoRA等のパラメータ効率的手法(PEFT)で単一GPU環境でも実施可能という実用性を備えており、分子特性予測・条件付き分子生成・反応予測という3つの主要なケモインフォマティクスタスクに対応する。
📣 3BパラメータのChemFM基盤モデル。スケーリング則でUniChemを学習データに選定し、34ベンチマーク全てでSOTAを超え、条件付き分子生成・反応予測でも最高性能。LoRAで単一GPU適応可能。 #ケモインフォマティクス #創薬AI
15. LLMize: A Framework for Large Language Model-Based Numerical Optimization▶ スライドあり
DOI: なし(arXiv:2601.00874v1) · 📅 2025年12月(arXiv プレプリント) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
LLMize は LLM をブラックボックス数値最適化エンジンとして活用するオープンソース Python フレームワーク(MIT ライセンス)である。OPRO(Optimization by PROmpting)・HLMEA(Hybrid LLM-Evolutionary Algorithm)・HLMSA(Hybrid LLM-Simulated Annealing)の3戦略を統合する。最大の特徴は、問題の目的関数・制約・ドメインヒューリスティックを自然言語でプロンプトに直接記述できる点であり、数式化困難な複雑な最適化問題—創薬分子設計、工学設計、物理シミュレーションベースの設計—に対して、数学的プログラミングや発見的アルゴリズム設計の専門知識なしに適用できる。
📣 LLMize: 自然言語でドメイン知識・制約を注入できるLLMブラックボックス最適化FW。OPRO/HLMEA/HLMSA対応。objective_fn定義だけで分子設計・ドッキングパラメータ最適化に即応用可。OSS。
16. HELM-BERT: A Transformer for Medium-Sized Peptide Property Prediction▶ スライドあり
DOI: なし(arXiv:2512.23175v1) · 📅 2025年12月(arXiv プレプリント) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
HELM-BERT は、HELM(Hierarchical Editing Language for Macromolecules)表記に基づく最初のEncoder型ペプチド言語モデルである。SMILES表記(原子単位トークン化)とアミノ酸配列表記(残基単位)の両方が持つ中規模ペプチドへの不適合を解消するため、HELM のモノマー単位トークン化を採用し、環状ペプチドのトポロジーと非天然残基の化学修飾を明示的に記述する。DeBERTa アーキテクチャ(6層 Transformer, H=768, A=12)に3つの構造的革新を加えて構成される。
📣 HELM-BERT: HELM表記で環状・修飾ペプチドを直接モデル化する初のEncoder型言語モデル。SMILESモデルを凌駕する膜透過性・PPI予測。39k修飾ペプチドで訓練。ペプチド創薬に直結。
17. aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists▶ スライドあり
DOI: なし(arXiv:2508.15126v2) · 📅 2025年8月(arXiv プレプリント、v2: 2025年12月更新) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
aiXivは、人間とAIの両方の科学者が研究提案・論文を投稿・査読・反復改善できる次世代オープンアクセスプラットフォームである。中核的な技術的貢献は3点ある。第一に、LLMエージェントが生成・査読・修正を繰り返す閉ループレビューパイプラインの設計。第二に、Retrieval-Augmented Generation(RAG)による根拠ある自動評価システム。第三に、AI査読エージェントへのプロンプトインジェクション攻撃を検出・防御するシグネチャベースのセキュリティ機構。プラットフォームはAPI(/submit, /review, /revise)およびMCP(Model Context Protocol)インターフェースを提供し、異種のAIエージェントと外部ツールのシームレスな統合を可能にする。
📣 aiXiv: AIと人間の科学者が共同する次世代論文プラットフォーム。RAG査読+閉ループ修正でAI生成研究の品質向上を実証。MCP統合でケムインフォ自動化にも応用可能。#AIScience
18. AI-Driven Molecular Design: Synergizing Deep Generative Models with Evolutionary Optimization▶ スライドあり
DOI: なし(会議録 EPSTEM Vol.38, pp.512-524) · 📅 2025年11月(IConTES 2025, Antalya/Türkiye) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
深層生成モデル(LSTM/GRU・VAE・GAN・GNN/GAT)と進化的最適化アルゴリズム(遺伝的アルゴリズム・多目的進化戦略)を組み合わせた de novo 分子設計の包括的レビュー論文である。各アーキテクチャの理論的背景・実装上の強みと限界を整理し、両パラダイムを融合したハイブリッドフレームワークが医薬品探索の効率化に与えるインパクトを論じる。著者グループ独自の研究として、VAE・グラフ予測器・Colibriアルゴリズム・フラグメントベース GA・動的多目的ペナルティを統合したフレームワークの開発が進行中であることも開示されている。
📣 深層生成モデル(VAE/GAN/GNN)×進化的最適化(GA/MOEA)の融合レビュー。生成モデルが多様候補提案、EAが多目的最適化を担う分子設計の新パラダイムを整理。lib/molgenへの直接応用可能。
19. LAMMPS-ANI: Large Scale Molecular Dynamics Simulations with ANI Neural Network Potential▶ スライドあり
DOI: 10.26434/chemrxiv-2025-8v03m · 📅 2025年(ChemRxiv プレプリント) · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
ANI(Accurate NeurAl networK engINe)は Behler-Parinello 型の対称関数記述子(AEV)をベースにしたニューラルネットワーク原子間ポテンシャル(MLIP)であり、量子力学(QM)計算データで訓練されることで古典力場をはるかに超える精度で分子系のポテンシャルエネルギー面を記述できる。本研究は ANI を大規模システムへスケールするために LAMMPS との統合インターフェース「LAMMPS-ANI」を開発した。中核的な技術成果は以下の3点である。
📣 LAMMPS-ANI: ANIニューラルポテンシャルを128 A100 GPUで1億原子MDに拡張。Allegro比30〜60倍速。HMR+SHAKE で100ns安定MD実現。HIV capsid 44M原子をQM精度で。#MLIP #MD
20. Unified all-atom molecule generation with neural fields▶ スライドあり
DOI: null (arXiv:2511.15906) · 📅 2025年11月 · 機械学習・AI
判断: 🔧 実装 📖 精読 📉 後回し
FuncBindは、小分子・マクロ環状ペプチド(MCP)・抗体CDRループという異なる分子モダリティを単一の統合モデルで生成するポケット条件付き分子生成フレームワーク。核心的なアイデアは分子を点群ではなくneural field(連続的な原子密度場)として表現することで、原子数の可変性・非カノニカルアミノ酸の表現・モダリティ横断の統合学習を同一アーキテクチャで実現する。3D CNN EncoderでR^(L³×C)の空間配列特徴マップlatentに圧縮し、条件付き3D U-Netデノイザー(拡散モデルまたはwalk-jump sampling)でlatent空間のスコアベース生成を行い、Gabor filterベースのneural field decoderで原子密度場を復元する。
📣 FuncBind:neural field(連続原子密度場)で小分子・マクロ環状ペプチド・抗体CDRを単一モデルで生成。in vitro抗体バインダーも実証。NeurIPS2025。コード・チェックポイント公開。arXiv:2511.15906