Reinforcement learning – Page 176

July 13, 2025

A Structure-Aware Framework for Learning Device Placements on Computation Graphsby Shukai Duan, Heng Ping, Nikos…

July 13, 2025

Deterministic Policies for Constrained Reinforcement Learning in Polynomial Timeby Jeremy McMahanFirst submitted to arxiv on:…

July 13, 2025

A Behavior-Aware Approach for Deep Reinforcement Learning in Non-stationary Environments without Known Change Pointsby Zihe…

July 13, 2025

Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Makingby Hanzhao Wang, Yu…

July 13, 2025

Variational Delayed Policy Optimizationby Qingyuan Wu, Simon Sinong Zhan, Yixuan Wang, Yuhui Wang, Chung-Wei Lin,…

July 13, 2025

Exclusively Penalized Q-learning for Offline Reinforcement Learningby Junghyuk Yeom, Yonghyeon Jo, Jungmo Kim, Sanghyeon Lee,…

July 13, 2025

Offline Reinforcement Learning from Datasets with Structured Non-Stationarityby Johannes Ackermann, Takayuki Osa, Masashi SugiyamaFirst submitted…

July 13, 2025

Formally Verifying Deep Reinforcement Learning Controllers with Lyapunov Barrier Certificatesby Udayan Mandal, Guy Amir, Haoze…

July 13, 2025

A finite time analysis of distributed Q-learningby Han-Dong Lim, Donghwan LeeFirst submitted to arxiv on:…

July 13, 2025

PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learningby Chengyang Ying, Zhongkai Hao, Xinning Zhou, Xuezhou Xu,…