Reinforcement learning – Page 88

July 13, 2025

Meta-Reinforcement Learning with Universal Policy Adaptation: Provable Near-Optimality under All-task Optimum Comparatorby Siyuan Xu, Minghui…

July 13, 2025

SimBa: Simplicity Bias for Scaling Up Parameters in Deep Reinforcement Learningby Hojoon Lee, Dongyoon Hwang,…

July 13, 2025

ContextWIN: Whittle Index Based Mixture-of-Experts Neural Model For Restless Bandits Via Deep RLby Zhanqiu Guo,…

July 13, 2025

ActSafe: Active Exploration with Safety Constraints for Reinforcement Learningby Yarden As, Bhavya Sukhija, Lenart Treven,…

July 13, 2025

HG2P: Hippocampus-inspired High-reward Graph and Model-Free Q-Gradient Penalty for Path Planning and Motion Controlby Haoran…

July 13, 2025

TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learningby Ge Li, Dong Tian, Hongyi Zhou, Xinkai Jiang, Rudolf…

July 13, 2025

Decision-Point Guided Safe Policy Improvementby Abhishek Sharma, Leo Benac, Sonali Parbhoo, Finale Doshi-VelezFirst submitted to…

July 13, 2025

Learning Algorithms Made Simpleby Noorbakhsh Amiri Golilarz, Elias Hossain, Abdoljalil Addeh, Keyan Alexander RahimiFirst submitted…

July 13, 2025

Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimizationby Kaixuan Ji, Guanlin Liu,…

July 13, 2025

Overcoming Slow Decision Frequencies in Continuous Control: Model-Based Sequence Reinforcement Learning for Model-Free Controlby Devdhar…