📚 週次論文レビュー — 🤖 機械学習・AI
対象期間: 2026-04-20 〜 2026-04-26
このページ: 41〜50件目
各ボタンは独立したトグル(複数同時ON可)
41. Assessing the potential of deep learning for protein–ligand docking
DOI: 10.1038/s42256-025-01160-1 · 📅 2025年(受理: 2025年11月) · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
タンパク質-リガンドドッキングに特化した包括的ベンチマーク「PoseBench」を提案した論文。従来の評価環境では(1)結晶構造(holo)タンパクを使い既知ポケットを指定する、という現実から乖離した条件が多かった。本研究は(1)AlphaFold3 予測の apo 構造のみ使用、(2)ポケット非指定(blind docking)、(3)マルチリガンド複合体も評価対象、という3条件を同時に課すことで、DL ドッキング手法の実用的な性能を初めて体系的に示した。主要な発見として、DL cofolding 手法(AF3/Chai-1/Boltz-1)が全体的に従来の AutoDock Vina を上回る一方、新規 PLI ポケットやマルチ…
📣 PoseBenchで11手法を比較。DL cofolding(AF3/Chai-1/Boltz-1)が全体的に優位だが新規ポケットでは64%止まり。AF3はMSA必須、Chai-1はESM2でMSA不要。化学特異性の課題が浮き彫りに。
42. Quantum-machine-assisted drug discovery
DOI: 10.1038/s44386-025-00033-2 · 📅 2026年(npj Drug Discovery, 2026, 3:1) · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
本論文は量子コンピューティングの創薬パイプライン全体への統合可能性を包括的にレビューした Perspective である。伝統的な計算機援用薬物設計が直面する根本的な限界(化学空間 10⁶⁰ の探索困難性・古典計算による量子力学的相互作用のモデリング限界)を量子コンピューティングがどのように克服しうるかを体系的に論じる。VQE(電子構造計算)・QAOA(組合せ最適化)・QGAN(分子生成)・量子カーネル法(DTI/SAR)・量子フェデレーテッドラーニング(QFL)という主要量子アルゴリズムを創薬の各フェーズ(分子シミュレーション→ヒット同定→リード最適化→臨床試験)に対応させて整理している。また超電導・トラップイオン・中性原子という…
📣 量子コンピュータが創薬を変える——VQE/QAOA/QGANの応用シナリオを網羅的にレビュー。近期現実的なのは量子カーネル法とQAOA最適化。fault-tolerant QCが来る前の準備が今🔬 DOI:10.1038/s44386-025-00033-2
43. Extrapolating Foundation Generative Models with Physics: A Case Study of Exploring Peptide Conformations under Protein-Environment Interactions
DOI: 10.1021/acs.jpclett.5c02567 · 📅 2025年12月(J. Phys. Chem. Lett. 受理) · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
近年、AlphaFold や RFdiffusion を代表とする基盤的な深層生成モデルは、タンパク質構造予測において目覚ましい成果を上げている。しかし、これらのモデルはタンパク質単体の構造を学習しており、有機リンカーを持つ環状ペプチドや材料表面に吸着したペプチドのように、タンパク質-環境相互作用(Protein-Environment Interactions; PEI)を含む系のコンフォメーション予測には対応していない。本論文は、こうした学習分布外ドメインへのモデル外挿を、再訓練やファインチューニングなしに実現する DiffPIE(Diffusion model for Proteins Interacting with the…
📣 DiffPIEが基盤拡散モデルを再訓練なしに拡張。物理ポテンシャルを逆拡散に注入し、リンカー付き環状ペプチドや金表面吸着ペプチドのコンフォメーションをMDより数桁高速に生成🧬 DOI:10.1021/acs.jpclett.5c02567
44. Automated Machine Learning Pipeline: Large Language Models-Assisted Automated Data set Generation for Training Machine-Learned Interatomic Potentials
DOI: 10.1021/acs.jctc.5c01610 · 📅 2025年12月(J. Chem. Theory Comput. オンライン先行公開) · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
機械学習ポテンシャル(MLIP)の開発は、高品質訓練データセット生成・量子化学計算パラメータの選択・モデルトレーニングと検証という複数の専門的作業を要する。本論文が提案する **AMLP(Automated Machine Learning Pipeline)** は、これら全工程を一元自動化するパイプラインである。.cifや.xyzの構造ファイルを入力として、LLMマルチエージェントが適切な量子化学手法(汎関数・基底関数・分散補正)を提案し、VASP/CP2K/Gaussian等のDFTコードへの入力を自動生成する。AIMD(ab initio MD)シミュレーション後に出力を.json形式で整理し、HDF5変換を経てMACEアー…
📣 LLMエージェントがDFTパラメータを提案し、AIMDデータ生成からMACEトレーニングまでを全自動化するAMLPを提案。アクリジン多形体でエネルギーMAE 2 meV/atom、ケミカルアキュラシーを大幅に下回る精度を達成。
45. DiffDec: Structure-Aware Scaffold Decoration with an End-to-End Diffusion Model
DOI: 10.1101/2023.10.08.561377 · 📅 2023年10月(bioRxiv preprint); J. Chem. Inf. Model. 2024掲載 · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
DiffDecは、タンパク質ポケットの3D構造を条件として分子スキャフォールドにR基(置換基)を付加するスキャフォールドデコレーション手法である。E(3)-equivariant GNN(EGNN)と確率的拡散モデル(DDPM)を組み合わせ、スキャフォールドとポケット原子をコンテキストとして固定しながらR基の3D座標と原子種を同時に生成する。R基サイズ予測を別モジュールとして持つ代わりに「フェイクアトム機構」を導入し、サイズの異なるR基を端から端まで(end-to-end)生成する点が特徴的である。アンカー(結合位置)は自動決定も可能で、実際の創薬シナリオにも対応する。
📣 EGNNと拡散モデルでポケット3D構造に条件付きR基生成。Recovery 69.67%でLibINVENT比2倍を達成。フェイクアトム機構でサイズ予測もend-to-end化。スキャフォールドデコレーション型リード最適化の新標準候補。
46. AlphaFold-RandomWalk and AlphaFold-Ensemble: Sampling Alternative Protein Conformations with Perturbed Versions of AlphaFold
DOI: 10.1021/acs.jcim.5c02004 · 📅 2025年12月(オンライン先行公開) · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
タンパク質は生物学的機能を発揮するために複数のコンフォメーションを採ることができるが、AlphaFold2(AF2)は単一の静的構造を予測することに最適化されており、代替配座の網羅的サンプリングには不向きである。本論文はこの問題に対し、AF2のモデル重みに系統的ガウスノイズを付加する **AlphaFold-RandomWalk(AF-RW)** と、2状態系タンパク質データセットでAF2をファインチューニングしたモデルアンサンブルを利用する **AlphaFold-Ensemble(AF-Ensemble)** を提案する。さらにこれら手法を自動5段階パイプライン **PAF-MD** に統合し、ML生成コンフォメーションをOpe…
📣 AlphaFold重みにノイズを注入してタンパク質の多様なコンフォメーションを生成するAF-RandomWalkとAF-EnsembleをMDパイプラインに統合。10タンパク質中5例でopen/closed両状態のサンプリングに成功し、構造ベース創薬への応用を示した。
47. Improving the Reliability of Molecular String Representations for Generative Chemistry
DOI: 10.1021/acs.jcim.4c02261 · 📅 2025年 · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
生成化学において最も広く使用されているSMILESと、それへの代替として提案されたSELFIESという2つの分子文字列表現の信頼性を包括的に評価し、両者の課題を解決するClearSMILESを提案した研究である。canonical SMILESは文法的に正しい文字列でも有効な分子を表さないケースが約20%存在するのに対し、SELFIESは全文字列が有効分子に対応するが学習データの物性分布から大きく逸脱する(fidelity低下)問題がある。これらを定量化するためにviabilityとfidelityという2つの評価基準を定義し、確率的SMILES拡張手法ClearSMILESによって無効サンプル率を2.2%まで削減しつつ忠実度も維持…
📣 SMILES(無効率20%)とSELFIES(fidelity低)の課題を定量化。Kekulé形式+確率的拡張のClearSMILESで無効率を2.2%まで削減しfidelityも維持。生成モデルの表現選択に重要な知見。
48. TorchANI 2.0: An Extensible, High-Performance Library for the Design, Training, and Use of NN-IPs
DOI: 10.1021/acs.jcim.5c01853 · 📅 2025年10月 · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
ニューラルネットワーク原子間ポテンシャル(NN-IP)のオープンソースPyTorchライブラリTorchANIの大幅改良版(2.0)である。Behler-Parrinello型ネットワーク(BPNNスタイル)をベースとしたANIアーキテクチャを維持しながら、CUDA最適化原子環境ベクトル(CUAEV)・バッチアンサンブル推論・モジュラー近傍リストによる大幅な性能向上を実現した。さらに正確な物理的制約(正しい解離限界・短距離GFN2-xTB反発・長距離D3分散・スムーズGELU活性化)を組み込んだ三種の新ANIモデル(ANI-2xr, ANI-2xr-snn, ANI-2dr)を提供する。MITライセンスで公開(https://git…
📣 TorchANI 2.0公開。CUDA加速AEV+物理制約(正確な解離限界・GFN2-xTB反発・D3分散)付きNN-IP。ASE統合でMD対応。3新モデル提供。MIT公開で非標準リガンドMDの精度向上に期待。
49. ADvisor: An Open-Source Tool for Applicability Domain Definition and Optimization in Molecular Predictive Modeling
DOI: 10.1021/acs.jcim.5c01672 · 📅 2025年10月 · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
QSARや機械学習に基づく分子予測モデルの信頼性を担保するために不可欠な適用領域(Applicability Domain, AD)の定義・最適化を支援するオープンソースツール「ADvisor」を開発した研究である。ADは「モデルが信頼できる予測を行える化学空間の範囲」を定義するものであり、OECDガイドラインでも規制上の要件として明記されているが、単一の標準手法は存在しない。本研究ではOECD準拠データセットで学習した回帰モデルを対象に複数のAD手法を系統的にベンチマークし、規制機関で採用されているDaniali et al.の手法をオープンソースで再実装・最適化したうえで、モデル・データセット適応的なAD選択を可能にするモジュラ…
📣 QSARモデルの適用領域(AD)定義を最適化するオープンソースツールADvisorを開発。複数AD手法のベンチマークとDaniali法の再実装でOECD準拠かつ柔軟なモデル信頼性評価を実現。
50. Navigating Ultralarge Virtual Chemical Spaces with Product-of-Experts Chemical Language Models
DOI: 10.1021/acs.jcim.4c01214 · 📅 2024年10月 · 機械学習・AI
判断:
🔧 実装
📖 精読
📉 後回し
超大規模仮想化学空間(約100億化合物)を効率的に探索するため、Product-of-Experts(PoE)化学言語モデルを提案した論文である。ターゲット化学空間をスパース列挙したデータで学習したPriorモデルと、所望・非所望の物性でfine-tuningしたExpert/Anti-expertモデルを組み合わせ、三者のlogitsを加重和することで制御された化合物生成を実現する。生成された化合物の大多数がビルディングブロックベースの合成可能な化学空間内に存在し、かつDRD2ドッキングスコアやBBB透過性といった所望の物性を示すことを実証した。ソースコードはGitHubで公開されている(https://github.com/sh…
📣 超大規模仮想化学空間(100億化合物)をLLaMAベースのPoE言語モデルで効率ナビゲート。生成物の90%超が合成可能空間内に留まりつつDRD2ドッキングとBBB透過性を同時最適化。コード公開済み。