Reinforcement learning – Page 186

July 13, 2025

Safe Reinforcement Learning with Learned Non-Markovian Safety Constraintsby Siow Meng Low, Akshat KumarFirst submitted to…

July 13, 2025

RICE: Breaking Through the Training Bottlenecks of Reinforcement Learning with Explanationby Zelei Cheng, Xian Wu,…

July 13, 2025

Finite-Time Convergence and Sample Complexity of Actor-Critic Multi-Objective Reinforcement Learningby Tianchen Zhou, FNU Hairi, Haibo…

July 13, 2025

Linear Convergence of Independent Natural Policy Gradient in Games with Entropy Regularizationby Youbang Sun, Tao…

July 13, 2025

Taming Equilibrium Bias in Risk-Sensitive Multi-Agent Reinforcement Learningby Yingjie Fei, Ruitu XuFirst submitted to arxiv…

July 13, 2025

Quality-Weighted Vendi Scores And Their Application To Diverse Experimental Designby Quan Nguyen, Adji Bousso DiengFirst…

July 13, 2025

Proximal Curriculum with Task Correlations for Deep Reinforcement Learningby Georgios Tzannetos, Parameswaran Kamalaruban, Adish SinglaFirst…

July 13, 2025

Off-OAB: Off-Policy Policy Gradient Method with Optimal Action-Dependent Baselineby Wenjia Meng, Qian Zheng, Long Yang,…

July 13, 2025

CTD4 – A Deep Continuous Distributional Actor-Critic Agent with a Kalman Fusion of Multiple Criticsby…

July 13, 2025

UDUC: An Uncertainty-driven Approach for Learning-based Robust Controlby Yuan Zhang, Jasper Hoffmann, Joschka BoedeckerFirst submitted…