Freie Universität BerlinのBonneauとClementiグループによる包括的レビュー。深層学習がMDの3大課題(精度・速度・サンプリング効率)をどのように緩和できるかを整理するとともに、DL-MDが抱える新たな課題(訓練データ不足・解釈性・転移可能性)とその対処法を論じる。ニューラルネットワークポテンシャル(NNP)・機械学習MD(MLMD)・粗視化(CG)モデル・拡散系強化サンプリングを体系的にカバーした標準的レビュー論文。
中国の2医療センターで2,069名を対象としたランダム化比較試験(RCT)により、LLMチャットボット「PreA」が初診から専門医への転送プロセスを効率化することを実証した臨床研究。PreAは問診・初期診断推論・検査オーダー・紹介状自動生成を担い、専門医診察時間を28.7%短縮(3.14 vs 4.41分)した。ケムインフォマティクスへの直接応用は限定的だが、ドメイン特化LLMエージェントのco-design設計方法論として参考になる研究。
分子基盤モデル(Molecular Foundation Models)のパフォーマンスはバックボーンアーキテクチャだけでなく、SMILESトークナイザーの設計にも大きく依存する。本研究はこの「トークナイザー選択問題」に正面から向き合い、35種の既存トークナイザーを統一評価フレームワークで比較するとともに、新たにSmirkおよびSmirk-GPEを提案した。評価指標はvocabulary coverage(未知トークン率)、fertility(1分子あたりのトークン数)、ダウンストリームタスク精度(分子生成・性質予測)の3軸。
109. BOLD-GPCRs: A Transformer-Powered App for Predicting Ligand Bioactivity across Class A GPCRs▶ スライドあり
DOI: 10.1021/acs.jcim.5c01858 · 📅 2026年(Journal of Chemical Information and Modeling, 66, 855-866) · 機械学習・AI
判断:
Provasi, Filizola ら(マウントサイナイ医科大学)が、Class A GPCR全体(826サブタイプ中165以上が創薬標的)にわたるリガンド活性と変異効果を予測するBOLD-GPCRsを発表した。GPCR創薬では多くのサブタイプでリガンドデータが乏しく、従来の手法では予測精度が低下する。転移学習でデータ豊富なGPCRの知識を希少GPCRに転移することで、この問題に対処した。Webアプリとして公開されており、実験化学者も使いやすいインターフェースを提供する。
📣 BOLD-GPCRs: 転移学習でClass A GPCR全体のリガンド活性と変異効果を予測。データ希少サブタイプでも高性能。Webアプリ公開。lib/dockingのGPCR特化スクリーニングに統合候補。 #GPCR #TransferLearning
110. MolOrgGPT: De Novo Generation via Large Language Models and Reinforcement Learning▶ スライドあり
DOI: 10.1021/acs.jcim.5c02400 · 📅 2026年(Journal of Chemical Information and Modeling) · 機械学習・AI
判断:
Varas Pardo, Campillo ら(スペイン・CNICSグループ)が、GPTアーキテクチャのLLMとRLを組み合わせたde novo分子生成フレームワークMolOrgGPTを発表した。大規模化合物DBで事前学習したLLMをドッキングスコアを報酬としたRLでファインチューニングし、アルツハイマー病関連タンパク質(AChE、BACE1等)向けの薬物様分子を生成した。生成候補のドッキング解析で有望な結合モードを持つ候補が複数同定された。