Reinforcement learning – Page 232

July 13, 2025

Do Transformer World Models Give Better Policy Gradients?by Michel Ma, Tianwei Ni, Clement Gehring, Pierluca…

July 13, 2025

Interactive Symbolic Regression through Offline Reinforcement Learning: A Co-Design Frameworkby Yuan Tian, Wenqi Zhou, Michele…

July 13, 2025

Three Pathways to Neurosymbolic Reinforcement Learning with Interpretable Model and Policy Networksby Peter Graf, Patrick…

July 13, 2025

Compressing Deep Reinforcement Learning Networks with a Dynamic Structured Pruning Method for Autonomous Drivingby Wensheng…

July 13, 2025

FlowPG: Action-constrained Policy Gradient with Normalizing Flowsby Janaka Chathuranga Brahmanage, Jiajing Ling, Akshat KumarFirst submitted…

July 13, 2025

Learning mirror maps in policy mirror descentby Carlo Alfano, Sebastian Towers, Silvia Sapora, Chris Lu,…

July 13, 2025

Context in Public Health for Underserved Communities: A Bayesian Approach to Online Restless Banditsby Biyonka…

July 13, 2025

Explaining Learned Reward Functions with Counterfactual Trajectoriesby Jan Wehner, Frans Oliehoek, Luciano Cavalcante SiebertFirst submitted…

July 13, 2025

Learning by Doing: An Online Causal Reinforcement Learning Framework with Causal-Aware Policyby Ruichu Cai, Siyang…

July 13, 2025

Code as Reward: Empowering Reinforcement Learning with VLMsby David Venuto, Sami Nur Islam, Martin Klissarov,…