Reinforcement learning – Page 140

July 13, 2025

Operator World Models for Reinforcement Learningby Pietro Novelli, Marco Pratticò, Massimiliano Pontil, Carlo CilibertoFirst submitted…

July 13, 2025

Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priorsby Emma Cramer, Bernd Frauenknecht, Ramil Sabirov,…

July 13, 2025

Reinforcement Learning for Efficient Design and Control Co-optimisation of Energy Systemsby Marine Cauz, Adrien Bolland,…

July 13, 2025

Meta-Gradient Search Control: A Method for Improving the Efficiency of Dyna-style Planningby Bradley Burega, John…

July 13, 2025

Contrastive Policy Gradient: Aligning LLMs on sequence-level scores in a supervised-friendly fashionby Yannis Flet-Berliac, Nathan…

July 13, 2025

Learning Pareto Set for Multi-Objective Continuous Robot Controlby Tianye Shu, Ke Shang, Cheng Gong, Yang…

July 13, 2025

Decentralized Semantic Traffic Control in AVs Using RL and DQN for Dynamic Roadblocksby Emanuel Figetakis,…

July 13, 2025

Spatial-temporal Hierarchical Reinforcement Learning for Interpretable Pathology Image Super-Resolutionby Wenting Chen, Jie Liu, Tommy W.S.…

July 13, 2025

Reinforcement Learning with Intrinsically Motivated Feedback Graph for Lost-sales Inventory Controlby Zifan Liu, Xinran Li,…

July 13, 2025

Mixture of Experts in a Mixture of RL settingsby Timon Willi, Johan Obando-Ceron, Jakob Foerster,…