Reinforcement learning – Page 117

July 13, 2025

Lifelong Reinforcement Learning via Neuromodulationby Sebastian Lee, Samuel Liebana, Claudia Clopath, Will DabneyFirst submitted to…

July 13, 2025

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Searchby Huajian Xin, Z.Z.…

July 13, 2025

Explaining an Agent’s Future Beliefs through Temporally Decomposing Future Reward Estimatorsby Mark Towers, Yali Du,…

July 13, 2025

Experimental evaluation of offline reinforcement learning for HVAC control in buildingsby Jun Wang, Linyan Li,…

July 13, 2025

An Efficient Continuous Control Perspective for Reinforcement-Learning-based Sequential Recommendationby Jun Wang, Likang Wu, Qi Liu,…

July 13, 2025

SustainDC: Benchmarking for Sustainable Data Center Controlby Avisek Naug, Antonio Guillen, Ricardo Luna, Vineet Gundecha,…

July 13, 2025

BCR-DRL: Behavior- and Context-aware Reward for Deep Reinforcement Learning in Human-AI Coordinationby Xin Hao, Bahareh…

July 13, 2025

Meta SAC-Lag: Towards Deployable Safe Reinforcement Learning via MetaGradient-based Hyperparameter Tuningby Homayoun Honari, Amir Mehdi…

July 13, 2025

Off-Policy Reinforcement Learning with High Dimensional Rewardby Dong Neuck Lee, Michael R. KosorokFirst submitted to…

July 13, 2025

Introduction to Reinforcement Learningby Majid Ghasemi, Dariush EbrahimiFirst submitted to arxiv on: 13 Aug 2024CategoriesMain:…