Reinforcement learning – Page 172

July 13, 2025

A CMDP-within-online framework for Meta-Safe Reinforcement Learningby Vanshaj Khattar, Yuhao Ding, Bilgehan Sel, Javad Lavaei,…

July 13, 2025

Reinforcement Learning for Jump-Diffusions, with Financial Applicationsby Xuefeng Gao, Lingfei Li, Xun Yu ZhouFirst submitted…

July 13, 2025

Synthesizing Programmatic Reinforcement Learning Policies with Large Language Model Guided Searchby Max Liu, Chan-Hung Yu,…

July 13, 2025

Variational Offline Multi-agent Skill Discoveryby Jiayu Chen, Bhargav Ganguly, Tian Lan, Vaneet AggarwalFirst submitted to…

July 13, 2025

Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learningby Shangding Gu, Bilgehan Sel, Yuhao…

July 13, 2025

Dynamic Inhomogeneous Quantum Resource Scheduling with Reinforcement Learningby Linsen Li, Pratyush Anand, Kaiming He, Dirk…

July 13, 2025

Diffusion-based Reinforcement Learning via Q-weighted Variational Policy Optimizationby Shutong Ding, Ke Hu, Zhenhao Zhang, Kan…

July 13, 2025

Theoretical Study of Conflict-Avoidant Multi-Objective Reinforcement Learningby Yudan Wang, Peiyao Xiao, Hao Ban, Kaiyi Ji,…

July 13, 2025

Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous controlby Michal Nauman, Mateusz Ostaszewski, Krzysztof…

July 13, 2025

Constrained Ensemble Exploration for Unsupervised Skill Discoveryby Chenjia Bai, Rushuai Yang, Qiaosheng Zhang, Kang Xu,…