Reinforcement learning – Page 71

July 13, 2025

Reinforcement Learning Gradients as Vitamin for Online Finetuning Decision Transformersby Kai Yan, Alexander G. Schwing,…

July 13, 2025

Q-learning for Quantile MDPs: A Decomposition, Performance, and Convergence Analysisby Jia Lin Hau, Erick Delage,…

July 13, 2025

ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNsby Yuchen Yang, Shubham Ugare,…

July 13, 2025

Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Useby Jiajun Xi, Yinong He,…

July 13, 2025

Maximum Entropy Hindsight Experience Replayby Douglas C. Crowder, Matthew L. Trappett, Darrien M. McKenzie, Frances…

July 13, 2025

Local Linearity: the Key for No-regret Reinforcement Learning in Continuous MDPsby Davide Maran, Alberto Maria…

July 13, 2025

Demystifying Linear MDPs and Novel Dynamics Aggregation Frameworkby Joongkyu Lee, Min-hwan OhFirst submitted to arxiv…

July 13, 2025

Progressive Safeguards for Safe and Model-Agnostic Reinforcement Learningby Nabil Omi, Hosein Hasanbeig, Hiteshi Sharma, Sriram…

July 13, 2025

RL-STaR: Theoretical Analysis of Reinforcement Learning Frameworks for Self-Taught Reasonerby Fu-Chieh Chang, Yu-Ting Lee, Hui-Ying…

July 13, 2025

Deterministic Exploration via Stationary Bellman Error Maximizationby Sebastian Griesbach, Carlo D'EramoFirst submitted to arxiv on:…