Reinforcement learning – Page 207

July 13, 2025

Towards Global Optimality for Practical Average Reward Reinforcement Learning without Mixing Time Oraclesby Bhrij Patel,…

July 13, 2025

Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theoryby Hengyu Fu, Zhuoran Yang,…

July 13, 2025

The Value of Reward Lookahead in Reinforcement Learningby Nadav Merlis, Dorian Baudry, Vianney PerchetFirst submitted…

July 13, 2025

Offline Multitask Representation Learning for Reinforcement Learningby Haque Ishfaq, Thanh Nguyen-Tang, Songtao Feng, Raman Arora,…

July 13, 2025

Variational Sampling of Temporal Trajectoriesby Jurijs Nazarovs, Zhichun Huang, Xingjian Zhen, Sourav Pal, Rudrasis Chakraborty,…

July 13, 2025

State-Separated SARSA: A Practical Sequential Decision-Making Algorithm with Recovering Rewardsby Yuto Tanimoto, Kenji FukumizuFirst submitted…

July 13, 2025

Prior-dependent analysis of posterior sampling reinforcement learning with function approximationby Yingru Li, Zhi-Quan LuoFirst submitted…

July 13, 2025

Independent RL for Cooperative-Competitive Agents: A Mean-Field Perspectiveby Muhammad Aneeq uz Zaman, Alec Koppel, Mathieu…

July 13, 2025

A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimizationby Yudong Luo, Yangchen…

July 13, 2025

Phasic Diversity Optimization for Population-Based Reinforcement Learningby Jingcheng Jiang, Haiyin Piao, Yu Fu, Yihang Hao,…