Reinforcement learning – Page 158

July 13, 2025

DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delaysby Bo Xia, Yilun Kong, Yongzhe…

July 13, 2025

By Fair Means or Foul: Quantifying Collusion in a Market Simulation with Deep Reinforcement Learningby…

July 13, 2025

iQRL – Implicitly Quantized Representations for Sample-efficient Reinforcement Learningby Aidan Scannell, Kalle Kujanpää, Yi Zhao,…

July 13, 2025

Aligning Large Language Models via Fine-grained Supervisionby Dehong Xu, Liang Qiu, Minseok Kim, Faisal Ladhak,…

July 13, 2025

Slow and Steady Wins the Race: Maintaining Plasticity with Hare and Tortoise Networksby Hojoon Lee,…

July 13, 2025

Towards Learning Foundation Models for Heuristic Functions to Solve Pathfinding Problemsby Vedant Khandelwal, Amit Sheth,…

July 13, 2025

Adaptive Layer Splitting for Wireless LLM Inference in Edge Computing: A Model-Based Reinforcement Learning Approachby…

July 13, 2025

A Generalized Apprenticeship Learning Framework for Modeling Heterogeneous Student Pedagogical Strategiesby Md Mirajul Islam, Xi…

July 13, 2025

Offline Bayesian Aleatoric and Epistemic Uncertainty Quantification and Posterior Value Optimisation in Finite-State MDPsby Filippo…

July 13, 2025

Test-Time Regret Minimization in Meta Reinforcement Learningby Mirco Mutti, Aviv TamarFirst submitted to arxiv on:…