Autonomous Diffractometry Enabled by Visual Reinforcement Learning (LaueRL)
joppli et al. | arXiv:2604.11773 | 2026年4月
🎯 ピクセル入力のみで単結晶Laue X線回折配向を完全自動化。結晶学知識・専門家監督なしにシミュレーション訓練のみで成功率100%を達成するVisual RLエージェント
① 背景と課題

Laue X線回折による単結晶の高対称軸配向(アライメント)は、これまで熟練した実験者が手動で行う必要があった。既存の自動化手法は結晶学の物理モデルや専門家ラベリングを必要とした。

既存教師あり学習:格子定数・空間群・検出器ジオメトリの正確な事前情報が必要
未知の多原子系や不純物を含む実試料への適用が困難

→ 物理モデルも専門ラベルも不要、ピクセルのみを入力とするモデルフリーRLエージェント

② DrMベースActor-Critic

DrM(Dormant Ratio Minimization)ベースのオフポリシーActor-Critic(DDPG系)。84×84ピクセルのLaue回折パターンを入力に2軸回転角を出力。

84×84px Laueパターン Conv2D×4 FC(50)+LN+Tanh 潜在表現 Actor MLP(1024) θ,φ角出力 報酬: 100×(d(t-1)−dt)/d0 + ゴールボーナス+100 訓練: 200k〜300kステップ ドメインランダム化: 格子定数・検出器距離・スポット欠損
② Sim-to-Real転移パイプライン

実験Laueパターンにメジアンフィルタ→ガウシアンスムージング→LoGスポット検出を適用してシミュレーションと同形式に変換。

ランダム化要素範囲
格子定数3〜15 Å
検出器距離4〜6 cm
スポット欠損率25%
スプリアスポット0〜10%
③ 本研究で示したこと(要点)
  • 立方晶・六方晶・正方晶の3結晶系で成功率100%達成
  • シミュレーションのみで訓練し実験装置でも成功率100%(sim-to-real転移)
  • エージェントが人間専門家に類似した「ハイウェイ」戦略を自律習得
  • 実験/シミュレーション間の平均エピソード長差が1〜2ステップ以内
④ 主な結果 (a) 結晶系別成功率
シミュレーション評価 成功率(%) 100% 100% 100% 立方晶 六方晶 正方晶 各5ランダムシード×5回 = 全ケース成功
④ 主な結果 (b) Sim-to-Real転移性能
結晶空間群sim-real差
SrTiO₃221(立方)≤1ステップ
CsV₃Sb₅191(六方)≤2ステップ
La₁.₅Sr₀.₅NiO₄139(正方)≤2ステップ

商用Laue装置(Meca500六軸ロボットアーム)で実験評価

<1°
直線検出アルゴリズムによる精密化後の最終精度
④ 主な結果 (c) エピソード長と対称性の相関
平均エピソード長(対称性低下と相関) 短い 長い 立方晶 六方晶 正方晶 対称性が低い→高対称ターゲット数↓→エピソード長↑
④ 主な結果 (d) 実装・公開情報
GitHub公開
https://github.com/joppli/laue_rl
Zenodo公開
https://doi.org/10.5281/zenodo.19485314

RLコード・Laueシミュレーター・実験パイプラインがすべて公開済み

DeepMind Control Suiteカスタマイズ版を使用

⑤ テイクホームメッセージ
知識ゼロから成功率100%
結晶学モデル不要・専門家ラベル不要。シミュレーション訓練のみで実験成功率100%
ドメインランダム化の威力
格子定数・検出器距離・スポット欠損をランダム化することでsim-to-real gap を克服
人間的戦略の自律習得
ハイウェイ戦略(高対称ライン沿いの経路)を専門家指導なしに自律発見
自律実験への道
放射光施設・電子回折等への一般化展望。材料科学の自律実験ワークフロー基盤
従来手法 vs LaueRL
手法物理モデル専門ラベル未知系
手動操作必要
教師あり学習必要必要×
LaueRL不要不要
本研究のインパクト
  • 自律実験ワークフローの実現に向けた材料科学の重要マイルストーン
  • コード・データ全公開でコミュニティへの即座の貢献
  • 中性子散乱・電子回折への展開で実験自動化の応用範囲が大幅に拡大