CRESTなどで生成した数百〜数千コンフォーマーのアンサンブルを高精度QM計算で精製するダウンストリームワークフローは、依然としてad-hocスクリプトと手動介入に依存しており、再現性・移植性が低かった。
→ JSON プロトコルファイル1枚で多段階精製・スペクトル生成・TS精製を自動実行するフレームワーク EnAn を開発
回転定数ベクトルノルム(|B|)とエネルギー差(ΔG)を同時閾値で比較し、構造アライメント不要の高速重複除去を実現。
原子間距離行列の固有値でPCA後、K-meansでクラスタリング。最適クラスター数をシルエットスコアで自動決定。
シルエットスコア最大化で自動的に最適クラスター数を選択
| スペクトル種 | 対象分子 | 類似度 |
|---|---|---|
| ECD (CAM-B3LYP) | ブロモフェニルオキシラン | 高 |
| VCD (B3LYP-D4) | ニトロ誘導体 | 96% |
| ECD (ωB97X-D4rev) | 同上 (比較) | 高 |
| 適用先 | ユースケース |
|---|---|
| lib/md | リガンドコンフォーマー精製パイプライン統合 |
| lib/md | MD トラジェクトリから代表構造をクラスタリング選別 |
| lib/fep | FEP 前処理として Boltzmann 重み付きコンフォーマー生成 |
| lib/docking | ドッキング前のリガンド立体配座最適化 |
回転定数ベース Pruner + PCA Clusterer を lib/md に実装することで既存 RMSDAnalyzer を補完できる
コード: github.com/andre-cloud/ensemble_analyzer