📚 月次論文レビュー — 🤖 機械学習・AI

対象期間: 2026-04-01 〜 2026-04-30このページ: 151〜160 件目各ボタンは独立したトグル（複数同時ON可）

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

151. Polyformer: a generative framework for thermodynamic modeling of polymeric molecules▶ スライドあり

DOI: null（arXiv: 2604.14241） · 📅 2026年4月（preprint） · 機械学習・AI

判断:

Valentini, Pekker, Liang, Martinez, Mukhopadhyay（PsiDagger・ピッツバーグ大・スタンフォード大）は、生体高分子（特にタンパク質）のコンフォメーションアンサンブルを熱力学的に正確に生成する生成モデル「Polyformer」を提案した。分子生物学の主流パラダイムは「配列が構造を決定し、構造が機能を決定する」という配列-構造-機能パラダイムから、「配列が決定するコンフォメーションアンサンブル全体が機能を決定する」というアンサンブルパラダイムへ移行しつつある。AlphaFoldはこの枠組みで配列から「単一最良コンフォメーション」を予測する問題を解決したが、分子が実際に採る構造分布（コンフォメーションアンサンブル）や温度依存的な変性挙動は予測できない。

📣 Polyformer：温度条件付きDiTでタンパク質コンフォメーションアンサンブルを生成。折り畳み・熱揺らぎ・熱変性を同時解決。AlphaFoldを超えた熱力学的アンサンブルモデル。アンサンブルドッキング応用に期待。

📊 一枚絵スライド ↗ 別タブ

152. The HTC-Claw: Automating Discovery through High-Throughput Computational Campaigns▶ スライドあり

DOI: null（arXiv: 2604.06076） · 📅 2025年4月（preprint） · 機械学習・AI

判断:

Zeng, Zhou et al.（上海交通大学）は、Materials Genome Initiative（MGI）の文脈における材料探索の自動化を目的に、LLMエージェントベースのインテリジェント高スループット計算プラットフォーム「HTC-Claw」を提案した。従来の高スループットフレームワーク（AiiDA, FireWorks等）は大量ジョブの送信・管理は得意だが「知性」を持たない、すなわちユーザーの科学的目標を自律的にタスクに分解したり中間計算結果に基づいてワークフローを動的更新したりする能力を欠く問題があった。HTC-ClawはOpenClawフレームワーク上でこの問題を解決し、自然言語の研究インテントから最終レポート生成まで一貫した自動化を実現した。

📣 HTC-Claw：LLMエージェントが研究目標を自動タスク分解→中間結果で動的ワークフロー更新→最終レポートまで全自動。OpenClawフレームワーク上の高スループット材料探索基盤。ケムインフォ転用に着目。

📊 一枚絵スライド ↗ 別タブ

153. UniSim: A Unified Simulator for Time-Coarsened Dynamics of Biomolecules▶ スライドあり

DOI: null（arXiv: 2506.03157） · 📅 2025年（ICML 2025） · 機械学習・AI

判断:

Yu, Huang, Liu（清華大学・人民大学）は、分子動力学（MD）シミュレーションの本質的なボトルネックである時間スケール問題と単一ドメイン限定問題を同時に解決するモデル「UniSim」を提案した。古典MDは数値積分の安定性のためにΔt ≈ 10⁻¹⁵秒という極小タイムステップを必要とする。これに対し、時間粗視化ダイナミクス手法はX_t → X_{t+τ}（τ >> Δt）という大きなタイムステップでの状態遷移を直接学習することで、長時間挙動のサンプリングを大幅に加速する。既存の深層学習ベースの手法（FBM, Timewarp等）はすでにこのアプローチを採用しているが、ペプチドのみ・タンパク質のみなど単一ドメインへの適用に限定されており、未知の分子系への転移可能性が低かった。

📣 UniSim（ICML 2025）: 小分子・ペプチド・タンパク質に転移可能な時間粗視化MDシミュレーター。マルチドメイン事前学習+Stochastic Interpolant+Force Guidanceで既存手法を上回る。コード公開済み。

📊 一枚絵スライド ↗ 別タブ

154. LinkLlama: Enabling Large Language Model for Chemically Reasonable Linker Design▶ スライドあり

DOI: 10.64898/2026.04.15.718690 · 📅 2026年4月（bioRxiv preprint） · 機械学習・AI

判断:

Sun, Wang, Purnomo, Cavanagh, Alteri, Head-Gordon（UC Berkeley）は、フラグメントベース創薬（FBDD）におけるリンカー設計の化学的妥当性問題を解決するため、Meta Llama 3をChEMBL36由来の826万件のフラグメント-リンカー-フラグメント三つ組みでSupervised Fine-Tuning（SFT）したモデル「LinkLlama」を提案した。従来の3D生成モデルが35%程度にとどまっていた化学的妥当性率を80%超に引き上げることに成功した。

📣 LLMリンカー設計：LinkLlama（Llama 3 SFT）が化学的妥当性を35%→80%超に改善。自然言語プロンプトで幾何学+物性制約を指定、RL不要。PROTAC設計にも応用実証。FBDD加速ツール。

📊 一枚絵スライド ↗ 別タブ

155. Large language models for molecular design: bridging the gap between chemical syntax and biological semantics▶ スライドあり

DOI: 10.1016/j.drudis.2026.104634 · 📅 2026年3月（Drug Discovery Today Vol.31 No.2） · 機械学習・AI

判断:

LLM（大規模言語モデル）が化学シンタックス（分子の書き方ルール）と生物学的セマンティクス（分子の機能的意味）のギャップを埋める存在として創薬の分子設計に台頭している。Chen, Guo, Xue（上海工業大学・重慶大学）は本レビューで、配列ベース分子生成から構造条件付き設計、多目的リード最適化、そして自律的DMTA（Design-Make-Test-Analyze）サイクルを実行するエージェントシステムまで、LLM駆動分子設計の進化を体系的に整理した。従来のディープ生成モデル（VAE・GAN・拡散モデル等）が個別ツールとして孤立していたのに対し、LLMは生成・推論・外部ツール統合を統一的に実現できる点が根本的な差別化として強調されている。

📣 LLMによる分子設計の全体像をレビュー。1D→3D、生成→自律DMTAエージェントへの進化を整理。ベンチマークと実験の乖離が最大課題。ハイブリッドニューロ-シンボリックへのロードマップを提示。

📊 一枚絵スライド ↗ 別タブ

156. Toward generalizable predictive models for DNA-encoded libraries▶ スライドあり

DOI: 10.1016/j.drudis.2026.104629 · 📅 2026年3月（Drug Discovery Today Vol.31 No.2） · 機械学習・AI

判断:

DNA-encoded library（DEL）技術は最大10^12規模の化合物に対してDNAバーコードを介したアフィニティ選択を可能にする高スループットスクリーニング技術であり、得られる大規模バインディングデータが機械学習のトレーニングに活用されている。本論文はPoongavanam, Turunen, Sandberg, Yngve, Wannberg（SciLifeLab Uppsala/KTH）がDEL-MLの能力と限界を批判的に整理したレビューで、Aurora Kinase A（AURKA）の150万点DEL選択データを用いた実例により、現行MLモデルの汎化性の壁を実証し、デノイジング戦略とドメイン適応による解決の方向性を示した。

📣 DEL×MLのヒット同定：汎化性が最大課題。BELKAで「既知空間は高精度・新規スキャフォールドで失敗」を実証。ドメイン適応で克服へ。AURKA150万点データで検証。

📊 一枚絵スライド ↗ 別タブ

157. Closing the loop: Experimentally validated methods in artificial intelligence–driven protein design▶ スライドあり

DOI: 10.1016/j.sbi.2026.103272 · 📅 2026年（Current Opinion in Structural Biology Vol.98） · 機械学習・AI

判断:

AI駆動タンパク質設計の研究は近年急速に進展しているが、その全体像を「実験的に検証された手法」という実践的観点で整理したレビューがなかった。本論文はKosonocky, Yang, Alamdari, Amini（Microsoft Research + UT Austin）が、データキュレーション・モデル開発・候補生成とフィルタリング・実験検証の4段階からなるエンドツーエンドパイプラインを軸に、バインダー・抗体・酵素の3応用領域で実験室での成功実績を持つ手法を体系的に整理したレビューである。計算成果だけでなく実験フィードバックループの重要性を中心に据えた点が特徴的。

📣 AI駆動タンパク質設計の実験検証済み手法を総合レビュー。RFdiffusion+ProteinMPNN+AF2フィルタの構造ベースと配列LMの2系統を整理。バインダー・抗体・酵素の成功率テーブルが実践的指針に。

📊 一枚絵スライド ↗ 別タブ

158. MAIP: An Open-Source Tool to Enrich High-Throughput Screening Output and Identify Novel, Druglike Molecules with Antimalarial Activity▶ スライドあり

DOI: 10.1021/acsmedchemlett.3c00369 · 📅 2023年 · 機械学習・AI

判断:

マラリアは世界人口の半数が感染リスクにさらされる重大感染症だが、耐性の出現により新規化学型が切実に求められている。本論文では、複数製薬機関（GSK・MMV 等）の化合物コレクションで訓練した consensus 機械学習モデル MAIP（Malaria Inhibitor Prediction）を実験的に検証した。MAIP は ChEMBL 経由で公開 API として無償提供されており、バーチャルスクリーニング候補の活性エンリッチメントやヒット-トゥ-リード段階の優先順位付けに利用できる。本論文では MAIP を用いた化合物選択ワークフローを構築し、実際の HTS（高スループットスクリーニング）との比較で 12 倍のエンリッチメントを達成し、良好な活性・ADME プロファイルを持つ 8 ヒットを発見した。

📣 複数機関データで学習した consensus QSAR「MAIP」で抗マラリア活性をランダム比12倍エンリッチ、8ヒットをwet labで確認。ChEMBL APIで無償公開。#Malaria #QSAR #VirtualScreening

📊 一枚絵スライド ↗ 別タブ

159. Accelerated Chemical Reaction Optimization Using Multi-Task Learning▶ スライドあり

DOI: 10.1021/acscentsci.3c00050 · 📅 2023年 · 機械学習・AI

判断:

C-H 活性化をはじめとする医薬品合成における反応最適化は、膨大な試行錯誤を要する。本論文では、複数の関連する反応最適化キャンペーンから蓄積されたデータを転移学習的に活用するマルチタスクベイズ最適化（MTBO）を提案し、自律フロー反応器プラットフォーム上で実際のメディシナルケミストリー応用を実証した。通常のベイズ最適化（BO）が「事前情報ゼロ」から探索を開始するのに対し、MTBO は過去の関連する反応データを活用することで初期の探索コストを大幅に削減し、より少ない実験数で最適条件を発見できる。

📣 過去の反応最適化データを転移学習するマルチタスクBOで実験反復数を50〜70%削減。自律フロー反応器で実証済み。分子最適化ループへの応用も有望。#BayesianOptimization #ReactionOptimization

📊 一枚絵スライド ↗ 別タブ

160. Systematic Evaluation of Local and Global Machine Learning Models for the Prediction of ADME Properties▶ スライドあり

DOI: 10.1021/acs.molpharmaceut.2c00962 · 📅 2023年 · 機械学習・AI

判断:

創薬における ADME（吸収・分布・代謝・排泄）特性の機械学習予測は、候補化合物の早期スクリーニングに欠かせないが、「グローバルモデル」（多プロジェクト・大規模データで学習）と「ローカルモデル」（特定プロジェクト・少数化合物で学習）のどちらが優れているかについては長年議論が続いていた。本論文では Novartis の社内データベースを用い、10 種の ADME アッセイ・112 創薬プロジェクトにわたってこの問いに系統的に回答した。結論として、グローバルモデルがすべてのアッセイ・プロジェクトで一貫してローカルモデルを上回り、その差異はデータ量や多様性ではなく「プロジェクト間の分布のずれ（data shift）」によって最もよく説明されることを示した。

📣 112プロジェクト・10 ADMEアッセイの大規模比較：グローバルMLモデルが常にローカルモデルを上回り、その差はデータシフトで説明可能。ADME予測は大規模一括モデルが最適。#ADME #MachineLearning #DrugDiscovery

📊 一枚絵スライド ↗ 別タブ

ページ: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17