MDGenやDeepJump等の軌道生成モデルは連続軌道を生成できるが、タンパク質単量体か、あるいはリガンド複合体かという「どちらか一方」の制約があった。時間方向の因果依存性を明示的に保持しないため長時間生成で誤差が蓄積しやすく、汎用MDサロゲートとして使える手法が存在しなかった。
→ SSMによる明示的状態保持 + Pairformerで単量体・複合体を統一アーキテクチャで処理
訓練データ:mdCATH(タンパク質単量体、5398ドメイン)とMISATO(タンパク質-リガンド複合体)を混合使用。AlphaFold2のペア表現行列(ペアワイズ特徴)を活用し、単量体と複合体の双方に対応する統一表現を学習。
GとIは同一アーキテクチャを異なる時間ストライドで訓練。任意の時間解像度に対応。
| モデル | 単量体 | 複合体 | 因果AR |
|---|---|---|---|
| AlphaFlow | △ (独立) | ✗ | ✗ |
| MDGen | ○ | ✗ | △ |
| BioMD | △ | ○ | ✗ |
| STAR-MD | ○ | ✗ | ○ |
| ATMOS | ○✓ | ○✓ | ○✓ |
単量体・複合体・因果ARの三者を同時満たす初のモデル