Revisiting Target-Aware de novo Molecular Generation with TarPass

Between Rational Design and Texas Sharpshooter — Qin, Chen, … Hou, Kang (Adv Sci 2026)

目標: target-aware生成モデル15種を統一プロトコルで横並び評価し、後付け正当化(Texas Sharpshooter)を排した汎化性能とPLI再現性を可視化する。

① 背景と課題

問題設定: Target-aware分子生成モデルは増えたが「ターゲット情報を本当に使っているのか、後付け解釈(Texas Sharpshooter)に過ぎないのか」が判別できない。docking score中央値だけでは粒度不足。

従来評価の限界:

② 手法 — TarPass benchmark + multi-tier post-filter

18ターゲット20構造（apo/holo・アロステリック含む）、専門家curatedのkey IFP、BindingDB由来活性化合物、ChEMBLランダム1000本のベースラインで構成。MMseqs2/Foldseekで<1%配列同一性のleakage統制。

③ 本研究で示したこと

④(a) ベースライン超え数

15モデル中、ChEMBLランダムベースラインを統計的有意に超えたのは合計6モデルのみ。3D in situパラダイムが最多だが多数派が未到達。

④(b) 生成スループット

non-3Dは0.1秒台、flowは1〜2秒、diffusion/autoregressiveは10秒超。実用VSへの組込みではpost-filterの軽さが効く。

④(c) reference化合物との距離

FCDが小さいほど活性化合物の特徴空間に近い。non-3Dが最近、3D in situ・最適化系は離れる傾向（多様性の代償）。

④(d) Multi-tier 濃縮

PLI hard constraint → plausibility → drug-likenessのカスケードで生成セットを2桁オーダー濃縮。任意の generator に汎用適用。

主要指標の比較

パラダイム	throughput	docking score 中央値	Lipinski 適合	key PLI 再現	FCD vs ref
non-3D	0.1 s/mol	−7前後	高	低〜中	低（近い）
3D in situ	1〜10 s/mol	−7.5〜−10	中	中	高
optimization-based	後処理依存	<−10	低（違反増）	中	中
ChEMBL random	—	−7前後	高	—	—

⑤ テイクホームメッセージ

本研究のインパクト