Reinforcement learning – Page 189

July 13, 2025

RLHF from Heterogeneous Feedback via Personalization and Preference Aggregationby Chanwoo Park, Mingyang Liu, Dingwen Kong,…

July 13, 2025

Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learningby Chenjia Bai, Lingxiao Wang,…

July 13, 2025

Numeric Reward Machinesby Kristina Levina, Nikolaos Pappas, Athanasios Karapantelakis, Aneta Vulgarakis Feljan, Jendrik SeippFirst submitted…

July 13, 2025

Continual Model-based Reinforcement Learning for Data Efficient Wireless Network Optimisationby Cengis Hasan, Alexandros Agapitos, David…

July 13, 2025

Towards Generalizable Agents in Text-Based Educational Environments: A Study of Integrating RL with LLMsby Bahar…

July 13, 2025

Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertaintyby Laixi Shi, Eric Mazumdar,…

July 13, 2025

Using Deep Q-Learning to Dynamically Toggle between Push/Pull Actions in Computational Trust Mechanismsby Zoi Lygizou,…

July 13, 2025

SAFE-RL: Saliency-Aware Counterfactual Explainer for Deep Reinforcement Learning Policiesby Amir Samadi, Konstantinos Koufos, Kurt Debattista,…

July 13, 2025

Learning Manipulation Tasks in Dynamic and Shared 3D Spacesby Hariharan Arunachalam, Marc Hanheide, Sariah MghamesFirst…

July 13, 2025

Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Reviewby Sergio A. Serrano, Jose Martinez-Carranza, L.…