📚 月次論文レビュー — 🤖 機械学習・AI
対象期間: 2026-04-01 〜 2026-04-30このページ: 71〜80 件目各ボタンは独立したトグル(複数同時ON可)
71. Can AI-Predicted Complexes Teach Machine Learning to Compute Drug Binding Affinity?▶ スライドあり
DOI: 10.1021/acs.jcim.5c01848 · 📅 2025年(受理: 2025年12月) · 機械学習・AI
判断:
AlphaFold3・Boltz-1x等のコフォールディングモデルが生成する合成タンパク質-リガンド複合体構造を、MLスコアリング関数(MLSF)のトレーニングデータ拡張に利用できるかを系統的に検証した研究。AEV-PLIG・EHIGNというGNNベースのMLSFおよびRF-Scoreを用いて、BindingNet v1/v2・HiQBind・Boltz-1x再現構造の各組み合わせで訓練し、FEPベンチマークセットで評価した。結論として「高品質な合成構造は実験構造と同等の訓練効果を持ち、単純な信頼スコア閾値で品質フィルタリングが可能」であることを実証した。
📣 コフォールディング予測で合成構造を拡張してMLSF訓練できるか検証。品質フィルタ(Boltz confidence>0.9)で実験構造と同等の訓練効果を確認。低品質データを大量追加しても無効。#ケムインフォマティクス #AlphaFold
72. Chemprop v2: An Efficient, Modular Machine Learning Package for Chemical Property Prediction▶ スライドあり
DOI: 10.1021/acs.jcim.5c02332 · 📅 2025年(受理: 2025年12月) · 機械学習・AI
判断:
Chemprop v2は、分子グラフから直接分子特性を予測する有向メッセージパッシングニューラルネットワーク(D-MPNN)ライブラリの完全再実装版である。オリジナルのchemprop(v1)はCLI中心の設計であったが、v2ではPythonライブラリとしての使いやすさを全面的に改善し、data / featurizers / nn / models / uncertaintyの5サブパッケージに整理されたモジュラーアーキテクチャに移行した。訓練速度は約2倍、メモリ使用量は約1/3に改善しながら、予測精度はv1と同等を維持する。GitHub 2,200+スター・PyPI 1.5M+ダウンロードの実績ある分子ML基盤ライブラリの次世代版として位置づけられている。
📣 chemprop v2 公開。D-MPNN を全面再設計しPython API化、v1比2倍高速・1/3メモリで精度同等。不確実性推定・アクティブラーニングも対応。SBVS前スクリーニングや分子生成スコアラーとして即活用可能。#ケムインフォ
73. Toward Generalizable Data-Driven Pharmacokinetics with Interpretable Neural ODEs▶ スライドあり
DOI: 10.1021/acs.jcim.5c02924 · 📅 2026-02 (J. Chem. Inf. Model. 2026, 66, 2640−2650) · 機械学習・AI
判断:
薬剤の血中濃度時間 (concentration-time, C-t) profile の予測は、創薬初期での候補化合物スクリーニングと臨床期の個別投与設計の両方を支える基幹技術である。従来は (a) compartmental ODE / PBPK のような mechanistic モデルが解釈性を提供する一方で構造的に異なる化合物への汎化が困難で、(b) ML/QSAR 由来の parameter regression は柔軟だが PK パラメータ → C-t curve の再構成段階で誤差が蓄積する、という相反する制約が存在した。
📣 Uni-PK 公開: Uni-Mol + 個体共変量を Neural ODE に joint embedding し C-t curve を直接予測。13 disease で zero-shot 汎化、50 件のヒト PK で W2F 改善。MIT。dosing-aware AD
74. SynFrag: Synthetic Accessibility Predictor based on Fragment Assembly Generation in Drug Discovery▶ スライドあり
DOI: 10.26434/chemrxiv-2025-33251 · 📅 2025(ChemRxiv preprint, CC BY 4.0) · 機械学習・AI
判断:
中国科学院上海薬物研究所(SIMM)と Lingang Laboratory の共同チームが提案した SynFrag は、AI 駆動の分子生成における「generation-synthesis gap」を埋める高速・高精度な合成可能性(Synthetic Accessibility, SA)予測モデルである。化学者が市販フラグメントから段階的に分子を組み立てる思考プロセスを、フラグメント組み立ての自己回帰生成タスクとして機械学習に翻訳した点が中心アイデアとなる。9.
📣 SynFrag:BRICS+2分解+自己回帰生成で合成可能性を予測。AiZynthFinder比7250倍高速(3411分→0.47分)。AI生成分子でも安定。OSS公開。
75. Practically Significant Method Comparison Protocols for Machine Learning in Small Molecule Drug Discovery▶ スライドあり
DOI: 10.1021/acs.jcim.5c01609 · 📅 2025年9月 · 機械学習・AI
判断:
AstraZeneca・Genentech・Novartis・Pfizer等の製薬企業研究者を中心とした国際グループが、小分子創薬MLの方法論比較プロトコルを定めたガイドライン論文。薬物発見データの特性(小規模・構造バイアス・不均衡・ノイジー)を踏まえ、(1)適切なデータ分割、(2)ドメイン適切な評価指標、(3)統計的有意性検定、(4)Bootstrap信頼区間を組み合わせた包括的ガイドラインを提示する。Pythonによるアノテーション付き実装例もSupporting Informationとして公開されている。
📣 創薬MLのベンチマーク改革:Scaffold split必須化・BEDROC/EF@1%をVS評価標準に・Wilcoxon検定で有意差確認・Bootstrap CI必須。製薬大手合同ガイドライン。見かけ性能詐欺を排除する実践的フレームワーク。
76. From Obstacle to Design Advantage: Activity Cliff Aware Modeling for Small-Molecule Drug Discovery▶ スライドあり
DOI: 10.1016/j.drudis.2025.104589 · 📅 2025年12月(Drug Discovery Today) · 機械学習・AI
判断:
ワルシャワ医科大学のSzostek・Szulczykによるパースペクティブ論文。「活性クリフ(Activity Cliff: AC)」——構造が非常に類似しているのに活性が大きく異なる化合物ペア——をMLモデルの障害ではなく「設計上の優位性」として再定義し、積極的に活用するための三層フレームワークを提案する。三層は(1)クリフ感受的な分子表現と事前学習、(2)クリフ特化評価指標(RMSEcliff・SALI・ACNet)、(3)クリフを意識したde novo生成から構成される。
📣 活性クリフを障害でなく設計ツールに。RMSEcliff・SALI・ACNet指標で従来MLの盲点を定量化。AC-aware表現学習・評価・de novo生成の三層ロードマップを提案。MoleculeACEで実装可能。
77. graphpancake: A Python package for representing organic molecules as molecular graphs utilizing electronic structure theory▶ スライドあり
DOI: 10.26434/chemrxiv-2025-xcq3k · 📅 2025(ChemRxiv preprint, MIT license) · 機械学習・AI
判断:
Northwestern 大学の Sneha Sil・Mark A. Maskeri・Karl A. Scheidt らが開発した graphpancake は、量子化学計算(DFT・post-Hartree Fock)と軌道解析(NPA・NBO)の出力を、機械学習に直接利用できる分子グラフ表現に変換するオープンソース Python パッケージである。SMILES から始まる完全な計算ワークフロー(OpenBabel/RDKit による 3D 化 → GFN2-xTB 配座探索 → r²SCAN-3c 構造最適化 → DLPNO-MP2 単点 → NBO 7.
📣 graphpancake:DFT/NBO/JANPA出力を分子グラフへ変換するOSSパッケージ。QM特徴量がSMILES由来特徴をR²で0.3-0.5上回り、小データQSARに最適。MIT公開。
78. A Foundation Model for Accurate Atomistic Simulations in Drug Design▶ スライドあり
DOI: 10.26434/chemrxiv-2025-f1hgn · 📅 2025年(ChemRxiv preprint) · 機械学習・AI
判断:
Qubit PharmaceuticalsとSorbonne大学のグループが開発した「FeNNix-Bio1」は、創薬向け原子論シミュレーションの基盤機械学習ポテンシャル(MLFF)である。合成量子化学データのみで訓練された分極性メッセージパッシングニューラルネットワーク(MPNN)で、手動パラメータ化を必要とせず量子精度の反応性MDを実現する。Freesolvデータセット600分子以上での水和自由エネルギー(HFE)計算でサブkcal/mol精度を達成し、最先端の特化力場を凌駕した。
📣 FeNNix-Bio1:創薬向け基盤NNP。合成QCデータ訓練、手動FF不要。Freesolv HFEでサブkcal/mol精度達成、特化力場を凌駕。反応性MD・ABFE・タンパク質フォールディングに対応。創薬MDの新パラダイム。
79. A Systematic Review of Drug-Related Interactions Utilizing Deep Learning and LLMs for Prediction and Mitigation▶ スライドあり
DOI: 10.1021/acsomega.5c04997 · 📅 2025年12月 · 機械学習・AI
判断:
2020〜2025年に発表された100本超の論文を対象に、深層学習・機械学習・LLMを活用した薬物相互作用予測の研究動向を体系的にレビューした。対象領域は薬物-薬物相互作用(DDI)、薬物-標的相互作用(DTI)、副作用(ADR)の三分野に集中し、これらを深層学習・グラフ学習・ハイブリッドモデル・NLP/LLMの四カテゴリで整理している。主要データベース(DrugBank・STITCH・ChEMBL・SIDER)の特徴や評価指標についても包括的に整理されている。
📣 DDI・DTI・ADR予測のDL/LLMレビュー100本超を分析。GNNはDTIでAUROC>0.90、LLMでADR自動抽出F1>0.80。三分野統合モデルの空白が最大のギャップ。創薬MLの実装参照まとめとして有用。
80. A Foundation Model for Accurate Atomistic Simulations in Drug Design▶ スライドあり
DOI: 10.26434/chemrxiv-2025-f1hgn-v4 · 📅 2025(ChemRxiv preprint) · 機械学習・AI
判断:
Sorbonne 大学・Qubit Pharmaceuticals が共同開発した FeNNix-Bio1 は、合成量子化学データのみで訓練されたニューラルネットワークポテンシャル(NNP)基盤モデルであり、手動力場パラメータ化なしに創薬関連のあらゆる原子論シミュレーションを量子精度で実行できる点が最大の特徴である。水和自由エネルギー(HFE)・タンパク質折り畳み・タンパク質-リガンド絶対結合自由エネルギー(ABFE)・化学反応を単一のモデルでカバーし、さらに核量子効果(NQE)を古典 MD フレームワーク内に組み込む Adaptive Quantum Thermal Bath(adQTB)を統合した。FreeSolv の 642 分子に対してサブ kcal/mol 精度(RMSE = 0.
📣 FeNNix-Bio1:DFTデータのみで訓練したNNP基盤モデル。手動FF不要でHFE RMSE=0.58kcal/mol(GAFF超え)、ABFE・タンパク質折り畳みも単一モデルでカバー。JAX公開。