Reinforcement learning – Page 47

July 13, 2025

PickLLM: Context-Aware RL-Assisted Large Language Model Routingby Dimitrios Sikeridis, Dennis Ramdass, Pranay PareekFirst submitted to…

July 13, 2025

Learning to Navigate in Mazes with Novel Layouts using Abstract Top-down Mapsby Linfeng Zhao, Lawson…

July 13, 2025

Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulationby Eliot Xing, Vernon Luk, Jean OhFirst submitted to…

July 13, 2025

MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximizationby Bhavya Sukhija, Stelian Coros, Andreas…

July 13, 2025

Hierarchical Meta-Reinforcement Learning via Automated Macro-Action Discoveryby Minjae Cho, Chuangchuang SunFirst submitted to arxiv on:…

July 13, 2025

AlphaZero Neural Scaling and Zipf’s Law: a Tale of Board Games and Power Lawsby Oren…

July 13, 2025

Generalized Bayesian deep reinforcement learningby Shreya Sinha Roy, Richard G. Everitt, Christian P. Robert, Ritabrata…

July 13, 2025

MGDA: Model-based Goal Data Augmentation for Offline Goal-conditioned Weighted Supervised Learningby Xing Lei, Xuetao Zhang,…

July 13, 2025

RL-LLM-DT: An Automatic Decision Tree Generation Method Based on RL Evaluation and LLM Enhancementby Junjie…

July 13, 2025

Auto-bidding in real-time auctions via Oracle Imitation Learning (OIL)by Alberto Silvio Chiappa, Briti Gangopadhyay, Zhao…