Advancing Reproducibility and Open Data in Theoretical and Computational Chemistry
JCTC + JCIM 連名エディトリアル 2026 — Amaro, Gagliardi et al. | DOI: 10.1021/acs.jctc.6c00733
📋 2026年5月1日より「データ・コード投稿時公開」をJCTC/JCIM論文に義務化
① 背景と動機

AI/MLの計算化学への急速な普及と計算データ規模の指数的拡大により、再現性確保の重要性が増している。多段階ワークフロー・特殊ソフトウェア・大規模異種データセットへの依存が深まる中、結果の文書化・保存・共有がより一層困難になっている。

2021年のJCIMエディトリアル(DOI: 10.1021/acs.jcim.0c01389)では原則論のみ → 今回は義務化に格上げ
AI/ML論文でのデータリーケージ・不完全な分割情報が深刻な問題として顕在化

→ FAIR原則(Findable, Accessible, Interoperable, Reusable)に基づく実践的ポリシーを策定

② 公開対象 8 カテゴリ
#カテゴリ主な内容
1スクリプト・コードGitHub/Zenodo公開、バージョン明記
2入出力ファイルREADME付き再現用サンプル
3座標・パラメータ非標準基底関数・FFパラメータ
4数値データエネルギー・自由エネルギー・観測量
5リスタートファイル計算継続用チェックポイント
6MD軌跡・代表構造再現・解釈のための軌跡と文書
7AI/MLモデルアーキテクチャ・HP・train/val/test分割
8PES・実装ポテンシャルサーフェスと使用ソフト
③ AI/ML論文への特別要件
  • モデルアーキテクチャとハイパーパラメータの完全開示
  • 訓練・検証・テストデータの分割情報を明示
  • 複数手法比較では同一 train/val/test 分割を強制
  • 再現スクリプト・メタデータを含む完全パッケージ
データリーケージ対策
同一分割強制によりML創薬の比較公正性を担保
④ 主要結果 (a) ポリシー適用タイムライン
2021 原則論 2026年5月 義務化 将来 評価・発展 JCIM指針 JCTC+JCIM 新ポリシー Reviews・Perspectives・Editorials は適用除外
④ 主要結果 (b) 推奨リポジトリ
リポジトリ特徴適合度
ZenodoDOI付き、無料、CERN運営⭐⭐⭐
GitHubコード版管理、GitHub Actions連携⭐⭐⭐
Figshare大容量データ、DOI付き⭐⭐
機関リポジトリ大学・研究機関管理⭐⭐
一時的アクセス手段(ZIP添付等)は原則非推奨
④ 主要結果 (c) 例外・免除規定
  • 機密・ライセンス制約・第三者所有権による開示困難は認める
  • 査読中は匿名性維持のための一時的アクセス提供も可
  • 量子コンピューティング環境の完全再現は困難として配慮
「主要結論の再現に必須でない制限コンポーネント」の判断は投稿者・査読者裁量に委ねられる
④ 主要結果 (d) パイプラインへの示唆
再現性対応の優先度 メタデータ記録 HIGH 乱数シード固定 HIGH Zenodo自動アーカイブ MED train/val/test分割管理 MED ハードウェア環境記録 LOW
⑤ ケムインフォマティクスパイプラインへの行動指針
📝 run_metadata.json の自動記録
各モジュール(lib/fep, lib/docking, lib/md, lib/molgen)の実行時に、ソフトウェアバージョン・パラメータ・乱数シードを自動的にJSONに記録するReproducibilityLoggerを実装。
🔢 random_seed の標準化
全モジュールで random_seed=42 をデフォルトとし、再現性テストを必須化。MLモデルのtrain/val/test分割をシード固定で固定化してCSVに保存。
📦 成果物のZenodoアーカイブ
重要な計算結果(スコアCSV・代表構造・モデル重み)をZenodoに自動アップロードするCI/CDスクリプトを整備。GitHub Actionsと連携してDOIを自動取得。
📊 MLモデル評価の公正化
JCIM/JCTC投稿を見据えて、ベンチマークデータセットのtrain/val/test分割をバージョン管理下に置き、比較モデル間で同一分割を強制する仕組みを整備。
パイプラインへの応用提案
対象具体的アクション
全モジュールReproducibilityLogger 横断実装
lib/molgen訓練データ分割・シード情報を MolgenYaml に追記
lib/fepFEP 計算パラメータと結果を自動アーカイブ
lib/mdトラジェクトリ・代表構造をZenodoに保存
エディトリアルのインパクト
  • JCTC/JCIM 投稿論文の再現性基準が 2026年5月から大幅引き上げ
  • AI/ML 計算化学論文のデータリーケージ問題に直接的対処
  • FAIR 原則をジャーナルポリシーに具体的に実装した先例となる