1日1兆リガンド: 性能ポータブルVSフレームワーク SWDOCKP2
Duan, Shen, Chen, Huang et al. — SC '25, November 2025, St Louis · DOI: 10.1145/3712285.3759833
🎯 DB2最適化+SIMD三線形補間+マルチターゲット並列で1日1.9兆ペアを達成(神威OceanLight/3,900万コア)
① スループット比較 — 業界最高記録
システムペア数/日コア数実行時間機械
AutoDock-GPU10億202,75212時間Summit
SWDOCK (2021)5,400億600万0.18時間TaihuLight
Vina@QNLM950億161,0018.5時間OceanLight
SWDOCKP2 (2025)1.9兆3,900万0.22時間OceanLight

SWDOCK比10倍以上。8標的同時スクリーニングで1日1.9兆ペアは史上初。

② 5つの主要革新
  • DB2整列・マージ: コンフォメーション基本成分をソート・統合し反復約50%削減
  • Early Bump: 衝突コンフォメーションを事前排除して無駄な計算を削除
  • SIMD三線形補間: エネルギーグリッド補間をSIMD並列化
  • マルチレセプター並列: 8標的グリッドをアライメントして同時処理
  • AthreadS: Sunway→x86等への性能ポータブルフレームワーク
③ スコアリング関数(UCSF DOCK 3ベース)
E = Σᵢ Σⱼ [ Aᵢⱼ/r¹² - Bᵢⱼ/r⁶ + 332.0·qᵢqⱼ/(D·rᵢⱼ) ] # 受容体側を事前グリッド化 (chemgrid/qnifft/solvmap) # リガンド原子位置で三線形補間 → O(N_lig_atoms)のみ

vdW(反発・引力)+静電相互作用を物理力場で評価。受容体計算はO(N_rec)の前計算に帰着させ、スクリーニング本体は高速化。

④ マルチターゲット並列グリッドアライメント
8標的
同時並列スクリーニング(単一ライブラリに対して)

複数受容体のエネルギーグリッドを統一座標系にアライメントし、SIMD命令とDMA通信でI/Oコストを最小化。アンサンブルドッキングへの応用も可能。

SIMD-AVX
DMA最適化
MPI並列
⑤ ML訓練データとしての副産物
1.9兆
タンパク質-リガンド相互作用予測データセット(生成中)
  • 実験データ希少性問題の解決策として提案
  • ML精度向上・生成化学・AI創薬に活用予定
  • 既存PLI公開データセットを桁違いに超える規模
⑥ 限界点
  • 神威OceanLight(非公開HPC)への依存が大
  • 精度検証(ROC-AUC/EF)の定量評価が論文に不在
  • 物理力場スコアリングのみ(MLスコアラー・柔軟受容体は非対応)
  • CUDA/ROCm GPU対応の情報が不明瞭
⑦ テイクホームメッセージ
🚀 兆スケールVSが現実に
1日1.9兆ペア(8標的)は業界初。化学空間の探索規模が2桁拡張された。
⚙️ DB2最適化が中心
コンフォメーション整列・マージで反復50%削減。Early Bump機構と組み合わせて大幅な無駄計算を排除。
📦 性能ポータビリティ
AthreadSでSunway固有最適化をx86等に移植。スーパーコンピュータ固有実装の汎用化に向けた設計。
🤖 超大規模PLIデータ生成
副産物として生成されるタンパク質-リガンド相互作用データセットがMLモデル訓練の変革的資源となる。
ケムインフォmaティクスへの応用
適用先実装優先度ユースケース
lib/dockingHighUniDockRunnerにEarly Bumpフィルタ追加
lib/dockingMediumマルチターゲット並列スクリーニングラッパー実装
lib/dockingMediumDB2コンフォメーション整列アルゴリズムの移植
lib/molgenLowSWDOCKP2生成PLIデータセットでMLスコアラー訓練