AlphaFold3以降の構造予測モデル(Boltz-1, Chai-1, Protenix)はPairformerの層数(深さ)を増やす拡張が主流だったが、9回のリサイクルで有効深さは既に十分。真のボトルネックはpair representation次元(128)にある。
→ 幅スケーリング・線形アテンション・大規模蒸留の3軸でスケーリングを実現
128→256で最大ゲイン、512まで単調改善(収穫逓減あり)
ϕ(Q)ϕ(K)ᵀVの右積トリックでO(n³d)→O(n²d)に削減。2種類提案:
2000残基でvanillaの10%以下のメモリ使用量
AlphaFold2(強いinductive bias)→ AlphaFold3(汎用Transformer)への移行でデータ要求が急増。対応策として3段構成の大規模蒸留:
| モデル | モノマーlDDT | Prot-Prot | Ab-Ag | Prot-Lig SR | Prot-RNA |
|---|---|---|---|---|---|
| AlphaFold3 | 0.88 | 72.93% | 47.90% | 64.90% | 62.32% |
| Boltz-1 | 0.87 | 68.25% | 33.54% | 56.90% | 50.91% |
| SeedFold | 0.8889 | 74.03% | 53.21% | 63.12% | 65.31% |
| SeedFold-Linear | 0.8861 | 74.14% | 46.91% | 66.48% | 61.80% |
SeedFold: モノマー・Ab-Ag・Prot-RNA で1位。SeedFold-Linear: Prot-Prot・Prot-Lig で1位。両者の相補性が顕著。
SeedFold-LinearをUniDockRunnerの前段構造予測に採用。未知ターゲットのhomology model dockingの精度向上(Prot-Lig SR +1.58pp vs AF3)
Gated Linear Triangular AttentionをHBondAnalyzer / RMSDAnalyzerの内部表現に応用。長トラジェクトリでのメモリ削減。
ByteDance製SeedFold、AlphaFold3超え🧬 Pairformer「幅スケーリング」が鍵。Linear三角アテンションでメモリO(n²d)削減+2650万件蒸留データ。タンパク-リガンドSR 66.5%で最高性能 #構造予測 #DrugDiscovery