Reinforcement learning – Page 223

July 13, 2025

Finite-Time Error Analysis of Online Model-Based Q-Learning with a Relaxed Sampling Modelby Han-Dong Lim, HyeAnn…

July 13, 2025

Reinforcement Learning as a Parsimonious Alternative to Prediction Cascades: A Case Study on Image Segmentationby…

July 13, 2025

Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamicsby Wang…

July 13, 2025

Advancing Translation Preference Modeling with RLHF: A Step Towards Cost-Effective Solutionby Nuo Xu, Jun Zhao,…

July 13, 2025

Self-evolving Autoencoder Embedded Q-Networkby J. Senthilnath, Bangjian Zhou, Zhen Wei Ng, Deeksha Aggarwal, Rajdeep Dutta,…

July 13, 2025

Programmatic Reinforcement Learning: Navigating Gridworldsby Guruprerana Shabadi, Nathanaël Fijalkow, Théo MatriconFirst submitted to arxiv on:…

July 13, 2025

Multi Task Inverse Reinforcement Learning for Common Sense Rewardby Neta Glazer, Aviv Navon, Aviv Shamsian,…

July 13, 2025

Reinforcement learning to maximise wind turbine energy generationby Daniel Soler, Oscar Mariño, David Huergo, Martín…

July 13, 2025

Debiased Offline Representation Learning for Fast Online Adaptation in Non-stationary Dynamicsby Xinyu Zhang, Wenjie Qiu,…

July 13, 2025

Optimizing Warfarin Dosing Using Contextual Bandit: An Offline Policy Learning and Evaluation Methodby Yong Huang,…