2024年にAlphaFold3がタンパク質-小分子複合体構造予測で大きな注目を集めたが、提供形態は学術用クローズドWebAPIに限られ、大規模VS(バーチャルスクリーニング)や商用利用には適さない。完全オープンソース版として登場した Boltz-2 は、ローカル実行・商用利用が可能で同等性能を謳うが、独立した第三者ベンチマークがほぼ存在せず、実創薬シナリオでの精度・速度が不明であった。
本研究は ChEMBL 356 ターゲット・10,933 化合物という独立ホールドアウトを構築し、配列のみからの apo 構造予測スコアと実測 pChEMBL の相関を初めて系統評価した。
入力は UniProt 配列+SMILES のみ(既知ホロ構造を使わない apo 推論)。出力ポーズと内部スコアを実測 pChEMBL と相関させ、ターゲット横断 MAE / Pearson r と ターゲット内 Spearman ρ を算出。NIM(Normal Inference Mode)でサンプリングを削減し速度を計測。
全体 MAE 0.9 はおよそ 10× の親和性誤差。Pearson r 0.45 は中程度の相関で、ランキング指標(ρ) の方が用途に直結する。
データ汚染の最小化: Boltz-2の学習カットオフ以降の活性データを優先的に収集し、リーク混入を低減。
評価軸の二本立て:
入力統一: UniProt 配列 + SMILES のみ。結晶構造を使わない apo 推論として評価することで、ホロ構造に依存する従来ドッキング (UniDock 等) との差異を明確化。
NIM はサンプリングステップ削減で 60〜90% の時間短縮。精度劣化は限定的で、数万件規模ライブラリのリランキングが現実的な計算時間に収まる。
| 適用先モジュール | ユースケース | 期待効果 |
|---|---|---|
| lib/docking | UniDockRunner 上位ポーズの Boltz-2 リランキング (NIM) | ヒット率向上 |
| lib/fep | FEP/MM-GBSA 対象の事前カスケードフィルタ | 計算コスト低減 |
運用時は標的ごとに既知 active/inactive で Spearman ρ を事前計測し、ρ > 0.5 を採用基準とすることで失敗標的を避けられる。