Reinforcement learning – Page 246

July 13, 2025

CycLight: learning traffic signal cooperation with a cycle-level strategyby Gengyue Han, Xiaohan Liu, Xianyue Peng,…

July 13, 2025

The ODE Method for Stochastic Approximation and Reinforcement Learning with Markovian Noiseby Shuze Daniel Liu,…

July 13, 2025

Learned Best-Effort LLM Servingby Siddharth Jha, Coleman Hooper, Xiaoxuan Liu, Sehoon Kim, Kurt KeutzerFirst submitted…

July 13, 2025

Safe Reinforcement Learning with Free-form Natural Language Constraints and Pre-Trained Language Modelsby Xingzhou Lou, Junge…

July 13, 2025

Go-Explore for Residential Energy Managementby Junlin Lu, Patrick Mannion, Karl MasonFirst submitted to arxiv on:…

July 13, 2025

Reinforcement Learning from LLM Feedback to Counteract Goal Misgeneralizationby Houda Nait El Barj, Theophile SautoryFirst…

July 13, 2025

BET: Explaining Deep Reinforcement Learning through The Error-Prone Decisionsby Xiao Liu, Jie Zhao, Wubing Chen,…

July 13, 2025

Open RAN LSTM Traffic Prediction and Slice Management using Deep Reinforcement Learningby Fatemeh Lotfi, Fatemeh…

July 13, 2025

Reinforcement Learning for Scalable Train Timetable Rescheduling with Graph Representationby Peng Yue, Yaochu Jin, Xuewu…

July 13, 2025

Identifying Policy Gradient Subspacesby Jan Schneider, Pierre Schumacher, Simon Guist, Le Chen, Daniel Häufle, Bernhard…