Reinforcement learning – Page 45

July 13, 2025

Offline Safe Reinforcement Learning Using Trajectory Classificationby Ze Gong, Akshat Kumar, Pradeep VarakanthamFirst submitted to…

July 13, 2025

Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Modelsby Yinlam Chow, Guy Tennenholtz, Izzeddin Gur,…

July 13, 2025

Deep reinforcement learning with time-scale invariant memoryby Md Rysul Kabir, James Mochizuki-Freeman, Zoran TiganjFirst submitted…

July 13, 2025

Hierarchical Subspaces of Policies for Continual Offline Reinforcement Learningby Anthony Kobanda, Rémy Portelas, Odalric-Ambrym Maillard,…

July 13, 2025

Entropy Regularized Task Representation Learning for Offline Meta-Reinforcement Learningby Mohammadreza Nakhaei, Aidan Scannell, Joni PajarinenFirst…

July 13, 2025

Single-Loop Federated Actor-Critic across Heterogeneous Environmentsby Ye Zhu, Xiaowen GongFirst submitted to arxiv on: 19…

July 13, 2025

Heterogeneous Multi-Agent Reinforcement Learning for Distributed Channel Access in WLANsby Jiaming Yu, Le Liang, Chongtao…

July 13, 2025

Stealing That Free Lunch: Exposing the Limits of Dyna-Style Reinforcement Learningby Brett Barkley, David Fridovich-KeilFirst…

July 13, 2025

Alignment faking in large language modelsby Ryan Greenblatt, Carson Denison, Benjamin Wright, Fabien Roger, Monte…

July 13, 2025

Harvesting energy from turbulent winds with Reinforcement Learningby Lorenzo Basile, Maria Grazia Berni, Antonio CelaniFirst…