AI/MLの計算化学への急速な普及と計算データ規模の指数的拡大により、再現性確保の重要性が増している。多段階ワークフロー・特殊ソフトウェア・大規模異種データセットへの依存が深まる中、結果の文書化・保存・共有がより一層困難になっている。
→ FAIR原則(Findable, Accessible, Interoperable, Reusable)に基づく実践的ポリシーを策定
| # | カテゴリ | 主な内容 |
|---|---|---|
| 1 | スクリプト・コード | GitHub/Zenodo公開、バージョン明記 |
| 2 | 入出力ファイル | README付き再現用サンプル |
| 3 | 座標・パラメータ | 非標準基底関数・FFパラメータ |
| 4 | 数値データ | エネルギー・自由エネルギー・観測量 |
| 5 | リスタートファイル | 計算継続用チェックポイント |
| 6 | MD軌跡・代表構造 | 再現・解釈のための軌跡と文書 |
| 7 | AI/MLモデル | アーキテクチャ・HP・train/val/test分割 |
| 8 | PES・実装 | ポテンシャルサーフェスと使用ソフト |
| リポジトリ | 特徴 | 適合度 |
|---|---|---|
| Zenodo | DOI付き、無料、CERN運営 | ⭐⭐⭐ |
| GitHub | コード版管理、GitHub Actions連携 | ⭐⭐⭐ |
| Figshare | 大容量データ、DOI付き | ⭐⭐ |
| 機関リポジトリ | 大学・研究機関管理 | ⭐⭐ |
| 対象 | 具体的アクション |
|---|---|
| 全モジュール | ReproducibilityLogger 横断実装 |
| lib/molgen | 訓練データ分割・シード情報を MolgenYaml に追記 |
| lib/fep | FEP 計算パラメータと結果を自動アーカイブ |
| lib/md | トラジェクトリ・代表構造をZenodoに保存 |