Reinforcement learning – Page 173

July 13, 2025

Pausing Policy Learning in Non-stationary Reinforcement Learningby Hyunin Lee, Ming Jin, Javad Lavaei, Somayeh SojoudiFirst…

July 13, 2025

Knowledge-Informed Auto-Penetration Testing Based on Reinforcement Learning with Reward Machineby Yuanliang Li, Hanzheng Dai, Jun…

July 13, 2025

SF-DQN: Provable Knowledge Transfer using Successor Feature for Deep Reinforcement Learningby Shuai Zhang, Heshan Devaka…

July 13, 2025

Efficient Mitigation of Bus Bunching through Setter-Based Curriculum Learningby Avidan Shah, Danny Tran, Yuhan TangFirst…

July 13, 2025

Spatio-temporal Value Semantics-based Abstraction for Dense Deep Reinforcement Learningby Jihui Nie, Dehui Du, Jiangnan ZhaoFirst…

July 13, 2025

Neuromorphic dreaming: A pathway to efficient learning in artificial agentsby Ingo Blakowski, Dmitrii Zendrikov, Cristiano…

July 13, 2025

Inverse-RLignment: Large Language Model Alignment from Demonstrations through Inverse Reinforcement Learningby Hao Sun, Mihaela van…

July 13, 2025

Model-free reinforcement learning with noisy actions for automated experimental control in opticsby Lea Richtmann, Viktoria-S.…

July 13, 2025

Counterexample-Guided Repair of Reinforcement Learning Systems Using Safety Criticsby David Boetius, Stefan LeueFirst submitted to…

July 13, 2025

Cross-Validated Off-Policy Evaluationby Matej Cief, Branislav Kveton, Michal KompanFirst submitted to arxiv on: 24 May…