What Happens in Successful Optimizations? A Survey of 2018-2024 Literature
J. Med. Chem. | Published 2026 | DOI: 10.1021/acs.jmedchem.5c03171
478組のヒット->候補ペアを解析し、リード最適化成功の定量パターン(MW+81Da・sp3↑・骨格70%保持)をデータドリブンに抽出
(1) 背景と課題

Lipinski 則・Ro5 など「望ましい物性レンジ」は古くから知られているが、ヒット化合物から前臨床候補へ進む過程で実際にどの物性がどれだけ動くかを大規模に追跡した研究はほぼ存在しなかった。従来は最終化合物の特性分布のみが議論され、最適化の「軌跡」自体は経験則・小規模事例に委ねられていた。

既存研究は最終物性のスナップショットに偏重し、ヒット->候補の Δ 値分布 が見えていない
最適化教科書の「MW を増やしすぎるな」「sp3 化せよ」は逸話的で、定量根拠が乏しい

-> 478 組の実成功ペアを集めて、最適化の動的パターンを統計的に記述する。

(2) 手法の概要
  • J. Med. Chem. と JACS の 2018-2024 掲載論文をスクリーニング
  • 「ヒット」と「前臨床候補」のペアを手作業+半自動で抽出
  • 各分子で MW / cLogP / HBD / HBA / PSA / Fsp3 / Murcko 骨格を算出
  • 478 ペアの Δ 値ヒストグラム・四分位範囲・t 検定で分布解析
  • Murcko 骨格の同一性で scaffold hop か周辺修飾かを分類
解析パイプライン 論文収集 JMC+JACS ペア抽出 478 組 物性計算 MW/Fsp3 等 Δ 分布解析 骨格比較 対象物性: MW, cLogP, HBD, HBA, PSA, Fsp3, Murcko 出力: ヒット->候補の Δ ヒストグラム + 骨格保持率 学術誌掲載済みの 成功事例のみ を対象 (survivor)
(3) 本研究で示したこと
  • MW は平均 +81 Da(中央値も正側)増加し、最適化で必ず重くなる
  • Fsp3(sp3 炭素比)は明確に 増加傾向、sp3 化は意図的に採用されている
  • cLogP は概ね 維持〜微減、水溶性への配慮が定着
  • Murcko 骨格は 約 70% が同一骨格を保持し、scaffold hop は少数派
  • HBD/HBA/PSA は穏やかな変化に留まり Ro5 レンジ内で動く
(4a) 分子量の Δ 分布
ΔMW ヒストグラム (478 ペア) 平均 +81 Da -100 -50 0 +50 +100 +150 +200 ΔMW (Da, hit -> candidate) ペア数

中央値 +50〜80 Da。負側の hit より軽くなる事例は少数派で、最適化=物量増を裏付ける。

(4b) Fsp3 と cLogP の変化
ヒット (青) vs 候補 (赤) 0.32 0.42 Fsp3 (平均) 3.4 3.2 cLogP (平均) ヒット 候補 478 ペア集計 ↑ sp3化 ≈ 維持

Fsp3 は明確に上昇 (約 +0.10) 一方 cLogP はほぼ動かず、立体性は増やすが脂溶性は増やさない方向で最適化されている。

(4c) Murcko 骨格保持率
ヒット -> 候補の骨格関係 (n=478) 478 ペア 同一骨格保持 ~70% 骨格内の改変 ~25% scaffold hop ~5% 大多数の最適化はコアを保ったまま 周辺置換基を増やす方向で進む
(4d) 物性 Δ サマリー表
指標ヒット平均候補平均Δ (代表値)
MW (Da)~370~451+81
Fsp3~0.32~0.42+0.10
cLogP~3.4~3.2-0.2
HBD~1.6~1.7+0.1
HBA~5.2~5.9+0.7
PSA (Ų)~75~85+10
Murcko 同一~70 % のペアで保持-

レビュー本文記載の傾向値から構築。代表値は分布の中心傾向。

(5) テイクホームメッセージ
最適化はだいたい "重く" なる
MW +50〜80 Da が中央値。軽量化を狙う最適化は例外であり、計算スコアラーで「+120 Da 以内」を許容する設計が現実的。
sp3 化は明示的な戦略
Fsp3 は +0.10 程度まで明確に上昇。芳香環過多のヒットを 3D 性のある候補に置き換える挙動が定着。
脂溶性は増やさない
cLogP は維持〜微減。MW を増やす際に極性官能基や sp3 を入れて logP を抑える "growing without greasing" がパターン化。
骨格は替えない
Murcko 同一性 70%。scaffold hop は最後の手段で、SAR を積み上げた骨格を保つ周辺改変が王道。
応用補足: ケムインフォ実装提案

本論文には計算化学手法は使われていない (純データ調査)。478 ペアは 計算創薬の事前知識として直接使える

  • lib/molgen: MolgenYaml に「ΔMW < +120 Da, ΔFsp3 > 0」フィルタを実装
  • lib/molgen: Murcko 同一性スコアラーを追加し scaffold hop を抑制
  • lib/docking: LBVS フィルタに「ヒット比 cLogP ±0.5」を組込み
  • lib/fep: ΔΔG 評価に hit->候補 Δ プロファイルの prior を導入
インパクト
  • 「成功した最適化はこう動く」を 478 ペア で初めて統計化
  • 分子生成 AI の事前分布・スコアラー設計に直接転用可
  • survivor bias を抱えつつも、現場の経験則を 定量根拠付き で補強
サバイバーバイアス: 失敗事例との比較は無い
タンパク質ファミリー別の傾向差は今後の課題