Reinforcement learning – Page 156

July 13, 2025

Proofread: Fixes All Errors with One Tapby Renjie Liu, Yanxiang Zhang, Yun Zhu, Haicheng Sun,…

July 13, 2025

Strategically Conservative Q-Learningby Yutaka Shimizu, Joey Hong, Sergey Levine, Masayoshi TomizukaFirst submitted to arxiv on:…

July 13, 2025

ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectoriesby Qianlan Yang, Yu-Xiong WangFirst submitted to arxiv…

July 13, 2025

Bootstrapping Expectiles in Reinforcement Learningby Pierre Clavier, Emmanuel Rachelson, Erwan Le Pennec, Matthieu GeistFirst submitted…

July 13, 2025

Breeding Programs Optimization with Reinforcement Learningby Omar G. Younis, Luca Corinzia, Ioannis N. Athanasiadis, Andreas…

July 13, 2025

HackAtari: Atari Learning Environments for Robust and Continual Reinforcement Learningby Quentin Delfosse, Jannis Blüml, Bjarne…

July 13, 2025

STEMO: Early Spatio-temporal Forecasting with Multi-Objective Reinforcement Learningby Wei Shao, Yufan Kang, Ziyan Peng, Xiao…

July 13, 2025

How does Inverse RL Scale to Large State Spaces? A Provably Efficient Approachby Filippo Lazzati,…

July 13, 2025

Behavior-Targeted Attack on Reinforcement Learning with Limited Access to Victim’s Policyby Shojiro Yamabe, Kazuto Fukuchi,…

July 13, 2025

Transductive Off-policy Proximal Policy Optimizationby Yaozhong Gan, Renye Yan, Xiaoyang Tan, Zhe Wu, Junliang XingFirst…