Reinforcement learning – Page 193

July 13, 2025

Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penaltyby Yanwei JiaFirst submitted to arxiv on: 19…

July 13, 2025

Data-Incremental Continual Offline Reinforcement Learningby Sibo Gai, Donglin WangFirst submitted to arxiv on: 19 Apr…

July 13, 2025

A Configurable Pythonic Data Center Model for Sustainable Cooling and ML Integrationby Avisek Naug, Antonio…

July 13, 2025

TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agentsby Chen Gong, Kecen Li, Jin Yao,…

July 13, 2025

Improving the interpretability of GNN predictions through conformal-based graph sparsificationby Pablo Sanchez-Martin, Kinaan Aamir Khan,…

July 13, 2025

Privacy-Preserving UCB Decision Process Verification via zk-SNARKsby Xikun Jiang, He Lyu, Chenhao Ying, Yibin Xu,…

July 13, 2025

SDIP: Self-Reinforcement Deep Image Prior Framework for Image Processingby Ziyu Shu, Zhixin PanFirst submitted to…

July 13, 2025

Actor-Critic Reinforcement Learning with Phased Actorby Ruofan Wu, Junmin Zhong, Jennie SiFirst submitted to arxiv…

July 13, 2025

VC Theory for Inventory Policiesby Yaqi Xie, Will Ma, Linwei XinFirst submitted to arxiv on:…

July 13, 2025

LTL-Constrained Policy Optimization with Cycle Experience Replayby Ameesh Shah, Cameron Voloshin, Chenxi Yang, Abhinav Verma,…