Protenix-v1: A Fully Open-Source Structure Prediction Model Surpassing AlphaFold3

ByteDance Seed / 2026年2月
DOI: 10.64898/2026.02.05.703733
Category: machine_learning
🎯 AF3を完全OSSで超え、創薬パイプラインの構造予測基盤を開放する

1背景と課題

2手法の概要

3本研究で示したこと

4主な結果

aAF3 比 精度ゲイン (%)
0 5 10 15 Δ精度 (%) ≈0 +5 +10 +8 Protein TM Ligand RMSD RNA-Prot 複合体 + Infer Scaling
単体タンパク質は同等。RNA-protein で +10%、推論時スケーリングで困難ターゲット +8% が突出。
b推論時スケーリング n vs 成功率
50 60 70 80 成功率 (%) 1 5 10 25 50 サンプル数 n (log scale) AF3 (n=1) ≈55% 56 63 72 単調増加: n↑ → success↑
困難ターゲットでは n=10 で +8%、n=50 で更に伸びる。コストとのトレードオフ。
cProtenix アーキテクチャ
Protein MSA Templates RNA MSA Ligand SMILES Pairformer (48 blocks) Diffusion (coord refine) Inference-time Scaling n samples → SLL + pLDDT → best 3D Complex (Protein+RNA+Ligand)
AF3 とほぼ同型のバックボーンに Template/RNA-MSA/推論スケーリングを追加した点が差分。
dOSS化の到達度比較
Protenix-v1 AlphaFold3 Boltz-1 推論コード 学習コード モデル重み 商用利用 RNA/Templ. ×
Protenix-v1 のみ全項目で完全公開・MIT ライセンス。AF3 は学習コード・商用が大幅制限。

5テイクホーム

① OSS化の決定打: AF3 級モデルが学習コードまで全公開。商用パイプラインに堂々と組込可能に。
② 弱点克服: RNA MSA 統合で RNA-protein +10%。AF3 が苦手な領域を狙い撃ち。
③ 創薬応用: UniDockRunner / FEP の前段で受容体生成 → 変異体・未解明標的の起点構造を無償取得