未決定 | 🔧 実装 📖 精読 📉 後回し

📚 週次論文レビュー — 🤖 機械学習・AI

対象期間: 2026-04-20 〜 2026-04-26 このページ: 51〜60件目 各ボタンは独立したトグル(複数同時ON可)
ページ: 1 2 3 4 5 6 7 8
51. ProfhEX: Empowering Early Drug Discovery with Machine Learning-Based Target Profiling and Liability Prediction
DOI: 10.1021/acs.jcim.5c02250 · 📅 2025年(受理: 2025年10月15日) · 機械学習・AI
判断:
ProfhEXは早期創薬を加速するために設計された多ターゲット活性予測プラットフォームの大規模アップデート版である。693のヒトタンパク質に対応する969の機械学習回帰モデルを搭載し、ChEMBL・PubChem・GOSTARから収集した500万件超の生物活性データポイントでトレーニングされている。ユーザーは最大100のSMILES文字列をバッチ入力として提出するだけで、インタラクティブなWebレポートと下流解析用のCSVファイルを受け取ることができる。プラットフォームはprofhex.exscalate.eu にて無償公開されている。
📣 ProfhEX: 693ヒトターゲット・969モデルのML活性予測プラットフォーム。5M超の生物活性データで訓練、R²=0.68・EF@5%=12.4達成。無償Web公開、バッチ100SMILES対応。早期創薬のオフターゲットリスク評価に活用できる。
📊 一枚絵スライド ↗ 別タブ
52. gSelformer-MV: Multiview, Subgraph-Augmented Group SELFIES Transformer for Molecular Property Prediction
DOI: 10.1021/acs.jcim.5c02342 · 📅 2025年(受理: 2025年12月) · 機械学習・AI
判断:
gSelformer-MVは、Group SELFIES(官能基レベルのトークンを含むSELFIES拡張表現)の複数ビューを用いたサブグラフ拡張によって、分子の原子レベルと官能基レベルの両方を同時に考慮した表現学習を行うトランスフォーマーモデルである。ModernBERT-large(395Mパラメータ)をベースとし、MLM(Masked Language Modeling)事前学習とコントラスト学習(CL)の2段階事前学習を経て、QSPR予測タスクにfine-tuningする。MoleculeNet回帰ベンチマーク(ESOL・FreeSolv・Lipophilicity)で最先端性能を達成し、説明可能性・不確実性定量化においてもS…
📣 Group SELFIES の複数ビューでトランスフォーマーを事前学習するgSelformer-MV。ESOL等の回帰SOTAを達成し、官能基レベルの説明可能性と不確実性定量化も改善。ADMET予測スコアラーとして即活用候補。
📊 一枚絵スライド ↗ 別タブ
53. Can AI-Predicted Complexes Teach Machine Learning to Compute Drug Binding Affinity?
DOI: 10.1021/acs.jcim.5c01848 · 📅 2025年(受理: 2025年12月) · 機械学習・AI
判断:
AlphaFold3・Boltz-1x等のコフォールディングモデルが生成する合成タンパク質-リガンド複合体構造を、MLスコアリング関数(MLSF)のトレーニングデータ拡張に利用できるかを系統的に検証した研究。AEV-PLIG・EHIGNというGNNベースのMLSFおよびRF-Scoreを用いて、BindingNet v1/v2・HiQBind・Boltz-1x再現構造の各組み合わせで訓練し、FEPベンチマークセットで評価した。結論として「高品質な合成構造は実験構造と同等の訓練効果を持ち、単純な信頼スコア閾値で品質フィルタリングが可能」であることを実証した。
📣 コフォールディング予測で合成構造を拡張してMLSF訓練できるか検証。品質フィルタ(Boltz confidence>0.9)で実験構造と同等の訓練効果を確認。低品質データを大量追加しても無効。#ケムインフォマティクス #AlphaFold
📊 一枚絵スライド ↗ 別タブ
54. Chemprop v2: An Efficient, Modular Machine Learning Package for Chemical Property Prediction
DOI: 10.1021/acs.jcim.5c02332 · 📅 2025年(受理: 2025年12月) · 機械学習・AI
判断:
Chemprop v2は、分子グラフから直接分子特性を予測する有向メッセージパッシングニューラルネットワーク(D-MPNN)ライブラリの完全再実装版である。オリジナルのchemprop(v1)はCLI中心の設計であったが、v2ではPythonライブラリとしての使いやすさを全面的に改善し、data / featurizers / nn / models / uncertaintyの5サブパッケージに整理されたモジュラーアーキテクチャに移行した。訓練速度は約2倍、メモリ使用量は約1/3に改善しながら、予測精度はv1と同等を維持する。GitHub 2,200+スター・PyPI 1.5M+ダウンロードの実績ある分子ML基盤ライブラリの次世代…
📣 chemprop v2 公開。D-MPNN を全面再設計しPython API化、v1比2倍高速・1/3メモリで精度同等。不確実性推定・アクティブラーニングも対応。SBVS前スクリーニングや分子生成スコアラーとして即活用可能。#ケムインフォ
📊 一枚絵スライド ↗ 別タブ
55. Toward Generalizable Data-Driven Pharmacokinetics with Interpretable Neural ODEs
DOI: 10.1021/acs.jcim.5c02924 · 📅 2026-02 (J. Chem. Inf. Model. 2026, 66, 2640−2650) · 機械学習・AI
判断:
薬剤の血中濃度時間 (concentration-time, C-t) profile の予測は、創薬初期での候補化合物スクリーニングと臨床期の個別投与設計の両方を支える基幹技術である。従来は (a) compartmental ODE / PBPK のような mechanistic モデルが解釈性を提供する一方で構造的に異なる化合物への汎化が困難で、(b) ML/QSAR 由来の parameter regression は柔軟だが PK パラメータ → C-t curve の再構成段階で誤差が蓄積する、という相反する制約が存在した。本論文の Uni-PK は両者を融合し、Neural ODE (NODE) によって C-t cu…
📣 Uni-PK 公開: Uni-Mol + 個体共変量を Neural ODE に joint embedding し C-t curve を直接予測。13 disease で zero-shot 汎化、50 件のヒト PK で W2F 改善。MIT。dosing-aware AD
📊 一枚絵スライド ↗ 別タブ
56. SynFrag: Synthetic Accessibility Predictor based on Fragment Assembly Generation in Drug Discovery
DOI: 10.26434/chemrxiv-2025-33251 · 📅 2025(ChemRxiv preprint, CC BY 4.0) · 機械学習・AI
判断:
中国科学院上海薬物研究所(SIMM)と Lingang Laboratory の共同チームが提案した SynFrag は、AI 駆動の分子生成における「generation-synthesis gap」を埋める高速・高精度な合成可能性(Synthetic Accessibility, SA)予測モデルである。化学者が市販フラグメントから段階的に分子を組み立てる思考プロセスを、フラグメント組み立ての自己回帰生成タスクとして機械学習に翻訳した点が中心アイデアとなる。9.18M 分子の自己教師学習で「どのフラグメントがどのようにつながりやすいか」を学んだ後、SAscore 境界領域と synthesis difficulty cliff …
📣 SynFrag:BRICS+2分解+自己回帰生成で合成可能性を予測。AiZynthFinder比7250倍高速(3411分→0.47分)。AI生成分子でも安定。OSS公開。
📊 一枚絵スライド ↗ 別タブ
57. Practically Significant Method Comparison Protocols for Machine Learning in Small Molecule Drug Discovery
DOI: 10.1021/acs.jcim.5c01609 · 📅 2025年9月 · 機械学習・AI
判断:
AstraZeneca・Genentech・Novartis・Pfizer等の製薬企業研究者を中心とした国際グループが、小分子創薬MLの方法論比較プロトコルを定めたガイドライン論文。薬物発見データの特性(小規模・構造バイアス・不均衡・ノイジー)を踏まえ、(1)適切なデータ分割、(2)ドメイン適切な評価指標、(3)統計的有意性検定、(4)Bootstrap信頼区間を組み合わせた包括的ガイドラインを提示する。Pythonによるアノテーション付き実装例もSupporting Informationとして公開されている。
📣 創薬MLのベンチマーク改革:Scaffold split必須化・BEDROC/EF@1%をVS評価標準に・Wilcoxon検定で有意差確認・Bootstrap CI必須。製薬大手合同ガイドライン。見かけ性能詐欺を排除する実践的フレームワーク。
58. From Obstacle to Design Advantage: Activity Cliff Aware Modeling for Small-Molecule Drug Discovery
DOI: 10.1016/j.drudis.2025.104589 · 📅 2025年12月(Drug Discovery Today) · 機械学習・AI
判断:
ワルシャワ医科大学のSzostek・Szulczykによるパースペクティブ論文。「活性クリフ(Activity Cliff: AC)」——構造が非常に類似しているのに活性が大きく異なる化合物ペア——をMLモデルの障害ではなく「設計上の優位性」として再定義し、積極的に活用するための三層フレームワークを提案する。三層は(1)クリフ感受的な分子表現と事前学習、(2)クリフ特化評価指標(RMSEcliff・SALI・ACNet)、(3)クリフを意識したde novo生成から構成される。
📣 活性クリフを障害でなく設計ツールに。RMSEcliff・SALI・ACNet指標で従来MLの盲点を定量化。AC-aware表現学習・評価・de novo生成の三層ロードマップを提案。MoleculeACEで実装可能。
59. graphpancake: A Python package for representing organic molecules as molecular graphs utilizing electronic structure theory
DOI: 10.26434/chemrxiv-2025-xcq3k · 📅 2025(ChemRxiv preprint, MIT license) · 機械学習・AI
判断:
Northwestern 大学の Sneha Sil・Mark A. Maskeri・Karl A. Scheidt らが開発した graphpancake は、量子化学計算(DFT・post-Hartree Fock)と軌道解析(NPA・NBO)の出力を、機械学習に直接利用できる分子グラフ表現に変換するオープンソース Python パッケージである。SMILES から始まる完全な計算ワークフロー(OpenBabel/RDKit による 3D 化 → GFN2-xTB 配座探索 → r²SCAN-3c 構造最適化 → DLPNO-MP2 単点 → NBO 7.0/JANPA 解析)が一気通貫で組まれており、最終的に得られる量子化学的…
📣 graphpancake:DFT/NBO/JANPA出力を分子グラフへ変換するOSSパッケージ。QM特徴量がSMILES由来特徴をR²で0.3-0.5上回り、小データQSARに最適。MIT公開。
📊 一枚絵スライド ↗ 別タブ
60. A Foundation Model for Accurate Atomistic Simulations in Drug Design
DOI: 10.26434/chemrxiv-2025-f1hgn · 📅 2025年(ChemRxiv preprint) · 機械学習・AI
判断:
Qubit PharmaceuticalsとSorbonne大学のグループが開発した「FeNNix-Bio1」は、創薬向け原子論シミュレーションの基盤機械学習ポテンシャル(MLFF)である。合成量子化学データのみで訓練された分極性メッセージパッシングニューラルネットワーク(MPNN)で、手動パラメータ化を必要とせず量子精度の反応性MDを実現する。Freesolvデータセット600分子以上での水和自由エネルギー(HFE)計算でサブkcal/mol精度を達成し、最先端の特化力場を凌駕した。
📣 FeNNix-Bio1:創薬向け基盤NNP。合成QCデータ訓練、手動FF不要。Freesolv HFEでサブkcal/mol精度達成、特化力場を凌駕。反応性MD・ABFE・タンパク質フォールディングに対応。創薬MDの新パラダイム。
📊 一枚絵スライド ↗ 別タブ
ページ: 1 2 3 4 5 6 7 8