PolarisHub 抗ウイルスADMETチャレンジは HLM/MLM代謝安定性・MDR1-MDCKII透過性・LogD・KSOL の5エンドポイントを対象とし、301〜425化合物という極小訓練データで予測精度を競う。
→ 既存の商用QSARモデル出力(AP12)をメタ特徴量として活用し、Prior-Data Fitted Network(TabPFN)でハイパーパラメータ探索なしに高精度を達成
赤数字: TabPFN(AP12+frag+metab)によるCatBoost基線からのMAE削減率。評価は対数変換後MAE。
CYP3A4代謝クリアランスがHLM予測の最重要特徴(SHAP解析)。AP12メタ特徴量が主要な情報源。
| 手法 | MAE ランク |
|---|---|
| GNN (1位) | 🥇 1st |
| ML + QM (2位) | 🥈 2nd |
| TabPFN(AP12+frag+metab) | 🥉 3位 |
| その他 (NN系) | 4位以下 |
コンペ後の最適化で1位(GNN)を除く全手法を上回るMAEを達成。商用ソフト不使用で実現。
| 適用先 | ユースケース | 期待効果 |
|---|---|---|
| lib/docking | UniDockヒットのADMET多エンドポイント予測フィルター | HLM/LogD/KSOL同時評価 |
| lib/molgen | 生成分子のADMETスコアラーとしてTabPFN統合 | ADMET多様性制御 |
| lib/docking | SHAPで重要ADMET記述子を特定→設計指針 | モデル解釈性向上 |
tabpfn / tabpfn_extensions はPyPI公開。RDKit記述子でAP12代替実装が可能。