Reinforcement learning – Page 211

July 13, 2025

A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspectiveby Yunpeng Qing, Shunyu liu, Jingyuan…

July 13, 2025

An Efficient Learning-based Solver Comparable to Metaheuristics for the Capacitated Arc Routing Problemby Runze Guo,…

July 13, 2025

Unveiling the Significance of Toddler-Inspired Reward Transition in Goal-Oriented Reinforcement Learningby Junseok Park, Yoonsung Kim,…

July 13, 2025

Acquiring Diverse Skills using Curriculum Reinforcement Learning with Mixture of Expertsby Onur Celik, Aleksandar Taranovic,…

July 13, 2025

Multi-Agent Reinforcement Learning with a Hierarchy of Reward Machinesby Xuejing Zheng, Chao YuFirst submitted to…

July 13, 2025

In-context Exploration-Exploitation for Reinforcement Learningby Zhenwen Dai, Federico Tomasi, Sina GhiassianFirst submitted to arxiv on:…

July 13, 2025

Quantifying the Sensitivity of Inverse Reinforcement Learning to Misspecificationby Joar Skalse, Alessandro AbateFirst submitted to…

July 13, 2025

RL-MSA: a Reinforcement Learning-based Multi-line bus Scheduling Approachby Yingzhuo LiuFirst submitted to arxiv on: 11…

July 13, 2025

Tactical Decision Making for Autonomous Trucks by Deep Reinforcement Learning with Total Cost of Operation…

July 13, 2025

Scalable Online Exploration via Coverabilityby Philip Amortila, Dylan J. Foster, Akshay KrishnamurthyFirst submitted to arxiv…