Autonomous Diffractometry Enabled by Visual Reinforcement Learning

Autonomous Diffractometry Enabled by Visual Reinforcement Learning (LaueRL)

joppli et al. | arXiv:2604.11773 | 2026年4月

🎯 ピクセル入力のみで単結晶Laue X線回折配向を完全自動化。結晶学知識・専門家監督なしにシミュレーション訓練のみで成功率100%を達成するVisual RLエージェント

① 背景と課題

Laue X線回折による単結晶の高対称軸配向（アライメント）は、これまで熟練した実験者が手動で行う必要があった。既存の自動化手法は結晶学の物理モデルや専門家ラベリングを必要とした。

既存教師あり学習：格子定数・空間群・検出器ジオメトリの正確な事前情報が必要

未知の多原子系や不純物を含む実試料への適用が困難

→ 物理モデルも専門ラベルも不要、ピクセルのみを入力とするモデルフリーRLエージェント

② DrMベースActor-Critic

DrM（Dormant Ratio Minimization）ベースのオフポリシーActor-Critic（DDPG系）。84×84ピクセルのLaue回折パターンを入力に2軸回転角を出力。

② Sim-to-Real転移パイプライン

実験Laueパターンにメジアンフィルタ→ガウシアンスムージング→LoGスポット検出を適用してシミュレーションと同形式に変換。

③ 本研究で示したこと（要点）

④ 主な結果 (a) 結晶系別成功率

④ 主な結果 (b) Sim-to-Real転移性能

商用Laue装置（Meca500六軸ロボットアーム）で実験評価

<1°

直線検出アルゴリズムによる精密化後の最終精度

④ 主な結果 (c) エピソード長と対称性の相関

④ 主な結果 (d) 実装・公開情報

GitHub公開

https://github.com/joppli/laue_rl

Zenodo公開

https://doi.org/10.5281/zenodo.19485314

RLコード・Laueシミュレーター・実験パイプラインがすべて公開済み

DeepMind Control Suiteカスタマイズ版を使用

⑤ テイクホームメッセージ

知識ゼロから成功率100%
結晶学モデル不要・専門家ラベル不要。シミュレーション訓練のみで実験成功率100%

ドメインランダム化の威力
格子定数・検出器距離・スポット欠損をランダム化することでsim-to-real gap を克服

人間的戦略の自律習得
ハイウェイ戦略（高対称ライン沿いの経路）を専門家指導なしに自律発見

自律実験への道
放射光施設・電子回折等への一般化展望。材料科学の自律実験ワークフロー基盤

従来手法 vs LaueRL

手法	物理モデル	専門ラベル	未知系
手動操作	必要	—	◎
教師あり学習	必要	必要	×
LaueRL	不要	不要	◎

本研究のインパクト