Reinforcement learning – Page 196

July 13, 2025

Dataset Reset Policy Optimization for RLHFby Jonathan D. Chang, Wenhao Zhan, Owen Oertell, Kianté Brantley,…

July 13, 2025

RLHF Deciphered: A Critical Analysis of Reinforcement Learning from Human Feedback for LLMsby Shreyas Chaudhari,…

July 13, 2025

Generalized Population-Based Training for Hyperparameter Optimization in Reinforcement Learningby Hui Bai, Ran ChengFirst submitted to…

July 13, 2025

SIR-RL: Reinforcement Learning for Optimized Policy Control during Epidemiological Outbreaks in Emerging Market and Developing…

July 13, 2025

Anti-Byzantine Attacks Enabled Vehicle Selection for Asynchronous Federated Learning in Vehicular Edge Computingby Cui Zhang,…

July 13, 2025

Efficient Duple Perturbation Robustness in Low-rank MDPsby Yang Hu, Haitong Ma, Bo Dai, Na LiFirst…

July 13, 2025

Asynchronous Federated Reinforcement Learning with Policy Gradient Updates: Algorithm Design and Convergence Analysisby Guangchen Lan,…

July 13, 2025

An Overview of Diffusion Models: Applications, Guided Generation, Statistical Rates and Optimizationby Minshuo Chen, Song…

July 13, 2025

On the Sample Efficiency of Abstractions and Potential-Based Reward Shaping in Reinforcement Learningby Giuseppe Canonaco,…

July 13, 2025

Reinforcement Learning with Generalizable Gaussian Splattingby Jiaxu Wang, Qiang Zhang, Jingkai Sun, Jiahang Cao, Gang…