Reinforcement learning – Page 89

July 13, 2025

Hierarchical Universal Value Function Approximatorsby Rushiv AroraFirst submitted to arxiv on: 11 Oct 2024CategoriesMain: Machine…

July 13, 2025

Can we hop in general? A discussion of benchmark selection and design using the Hopper…

July 13, 2025

MAD-TD: Model-Augmented Data stabilizes High Update Ratio RLby Claas A Voelcker, Marcel Hussing, Eric Eaton,…

July 13, 2025

Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficientby Wenlong Wang, Ivana Dusparic, Yucheng…

July 13, 2025

SOLD: Slot Object-Centric Latent Dynamics Models for Relational Manipulation Learning from Pixelsby Malte Mosbach, Jan…

July 13, 2025

Words as Beacons: Guiding RL Agents with High-Level Language Promptsby Unai Ruiz-Gonzalez, Alain Andres, Pedro…

July 13, 2025

Towards Sharper Risk Bounds for Minimax Problemsby Bowei Zhu, Shaojie Li, Yong LiuFirst submitted to…

July 13, 2025

Kaleidoscope: Learnable Masks for Heterogeneous Multi-agent Reinforcement Learningby Xinran Li, Ling Pan, Jun ZhangFirst submitted…

July 13, 2025

Reinforcement Learning for Control of Non-Markovian Cellular Population Dynamicsby Josiah C. Kratz, Jacob AdamczykFirst submitted…

July 13, 2025

Exploring Natural Language-Based Strategies for Efficient Number Learning in Children through Reinforcement Learningby Tirthankar MittraFirst…