RMSF(Root Mean Square Fluctuation)は残基ごとの揺らぎを表す古典的指標で、創薬におけるホットスポット同定・アロステリック解析・MD品質管理に広く用いられている。GROMACS / AMBER / 標準 MDAnalysis の RMSF 計算は、いずれも「時系列で並んだフレーム」を入力前提に設計されている。
近年は AlphaFold2 サブサンプリング(MSA を間引いて多数の構造を生成)や BioEmu のような 平衡アンサンブルを直接予測する DL モデル、さらに NMR・クライオEM 由来の構造分布が広く使われ始めたが、これらは「時間軸を持たない構造の集合」であり、既存 RMSF ツールでは直接扱えなかった。
→ 多様なアンサンブル源を一つの API に集約し、揺らぎを並置比較できるツールが必要。
protein and name CA)の RMSF を計算。backbone, resid 50:120 等)。pip install ermsfkit で導入可・MDAKit 公認・CC-BY 4.0 で公開。同一残基インデックスに 3 ソースを重ねて描けるのが eRMSF の中核機能。
| ソース | 局所flex | ドメインmotion | 計算コスト |
|---|---|---|---|
| MD(古典FF, μs級) | ○ | △〜○ | 高(GPU日〜週) |
| BioEmu(DL平衡) | ○ | ○ ただし過大 | 低(推論秒〜分) |
| AF2 subsampling | ○ | ×〜△ | 中(GPU 数十分) |
| NMR ensemble | ○ | △ | —(実験依存) |
| cryoEM(多状態) | △ | ○ | —(実験依存) |
MD を 真値の物差しに据え、DL アンサンブルのキャリブレーションを定量できる。
MDAKit 公認=MDAnalysis 公式に登録され、依存・テスト・型ヒントの最低基準を満たす。
protein and name CA既存 MD ワークフローに 1 行で組み込める軽量ライブラリ。
plot_overlay() を追加。RMSF Δ > 閾値 でフラグし、過剰柔軟領域を warn。flexible residue 候補として ProLIF / Meeko に橋渡し。