Reinforcement learning – Page 234

July 13, 2025

Reinforcement Learning from Bagged Rewardby Yuting Tang, Xin-Qiang Cai, Yao-Xiang Ding, Qiyu Wu, Guoqing Liu,…

July 13, 2025

No-Regret Reinforcement Learning in Smooth MDPsby Davide Maran, Alberto Maria Metelli, Matteo Papini, Marcello RestellFirst…

July 13, 2025

SEABO: A Simple Search-Based Method for Offline Imitation Learningby Jiafei Lyu, Xiaoteng Ma, Le Wan,…

July 13, 2025

Transductive Reward Inference on Graphby Bohao Qu, Xiaofeng Cao, Qing Guo, Yi Chang, Ivor W.…

July 13, 2025

Logical Specifications-guided Dynamic Task Sampling for Reinforcement Learning Agentsby Yash Shukla, Tanushree Burman, Abhishek Kulkarni,…

July 13, 2025

SUB-PLAY: Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systemsby Oubo Ma, Yuwen Pu, Linkang…

July 13, 2025

Diffusion World Model: Future Modeling Beyond Step-by-Step Rollout for Offline Reinforcement Learningby Zihan Ding, Amy…

July 13, 2025

A Reinforcement Learning Approach for Dynamic Rebalancing in Bike-Sharing Systemby Jiaqi Liang, Sanjay Dominik Jena,…

July 13, 2025

Assessing the Impact of Distribution Shift on Reinforcement Learning Performanceby Ted Fujimoto, Joshua Suetterlein, Samrat…

July 13, 2025

DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Designby Samuel Garcin, James Doran, Shangmin…