Trillion Ligands per Day

1日1兆リガンド: 性能ポータブルVSフレームワーク SWDOCKP2

Duan, Shen, Chen, Huang et al. — SC '25, November 2025, St Louis · DOI: 10.1145/3712285.3759833

🎯 DB2最適化+SIMD三線形補間+マルチターゲット並列で1日1.9兆ペアを達成（神威OceanLight/3,900万コア）

① スループット比較 — 業界最高記録

システム	ペア数/日	コア数	実行時間	機械
AutoDock-GPU	10億	202,752	12時間	Summit
SWDOCK (2021)	5,400億	600万	0.18時間	TaihuLight
Vina@QNLM	950億	161,001	8.5時間	OceanLight
SWDOCKP2 (2025)	1.9兆	3,900万	0.22時間	OceanLight

SWDOCK比10倍以上。8標的同時スクリーニングで1日1.9兆ペアは史上初。

図: 各システムの1日あたりスクリーニング・ペア数（論文Table 2の実測値、対数スケール）

② 5つの主要革新

③ スコアリング関数（UCSF DOCK 3ベース）

E = Σᵢ Σⱼ [ Aᵢⱼ/r¹² - Bᵢⱼ/r⁶ + 332.0·qᵢqⱼ/(D·rᵢⱼ) ] # 受容体側を事前グリッド化 (chemgrid/qnifft/solvmap) # リガンド原子位置で三線形補間 → O(N_lig_atoms)のみ

vdW（反発・引力）＋静電相互作用を物理力場で評価。受容体計算はO(N_rec)の前計算に帰着させ、スクリーニング本体は高速化。

④ マルチターゲット並列グリッドアライメント

8標的

同時並列スクリーニング（単一ライブラリに対して）

複数受容体のエネルギーグリッドを統一座標系にアライメントし、SIMD命令とDMA通信でI/Oコストを最小化。アンサンブルドッキングへの応用も可能。

SIMD-AVX

DMA最適化

MPI並列

⑤ ML訓練データとしての副産物

1.9兆

タンパク質-リガンド相互作用予測データセット（生成中）

⑥ 限界点

⑦ テイクホームメッセージ

🚀 兆スケールVSが現実に
1日1.9兆ペア（8標的）は業界初。化学空間の探索規模が2桁拡張された。

⚙️ DB2最適化が中心
コンフォメーション整列・マージで反復50%削減。Early Bump機構と組み合わせて大幅な無駄計算を排除。

📦 性能ポータビリティ
AthreadSでSunway固有最適化をx86等に移植。スーパーコンピュータ固有実装の汎用化に向けた設計。

🤖 超大規模PLIデータ生成
副産物として生成されるタンパク質-リガンド相互作用データセットがMLモデル訓練の変革的資源となる。

ケムインフォmaティクスへの応用

適用先	実装優先度	ユースケース
lib/docking	High	UniDockRunnerにEarly Bumpフィルタ追加
lib/docking	Medium	マルチターゲット並列スクリーニングラッパー実装
lib/docking	Medium	DB2コンフォメーション整列アルゴリズムの移植
lib/molgen	Low	SWDOCKP2生成PLIデータセットでMLスコアラー訓練