Reinforcement learning – Page 52

July 13, 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement Learningby Shuguang Yu, Shuxing Fang, Ruixin Peng,…

July 13, 2025

Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Applicationby Lucky LiFirst submitted to…

July 13, 2025

RL Zero: Zero-Shot Language to Behaviors without any Supervisionby Harshit Sikchi, Siddhant Agarwal, Pranaya Jajoo,…

July 13, 2025

Policy-shaped prediction: avoiding distractions in model-based reinforcement learningby Miles Hutson, Isaac Kauvar, Nick HaberFirst submitted…

July 13, 2025

Strategizing Equitable Transit Evacuations: A Data-Driven Reinforcement Learning Approachby Fang Tang, Han Wang, Maria Laura…

July 13, 2025

DRL4AOI: A DRL Framework for Semantic-aware AOI Segmentation in Location-Based Servicesby Youfang Lin, Jinji Fu,…

July 13, 2025

Reinforcement Learning: An Overviewby Kevin MurphyFirst submitted to arxiv on: 6 Dec 2024CategoriesMain: Artificial Intelligence…

July 13, 2025

Closed-Loop Supervised Fine-Tuning of Tokenized Traffic Modelsby Zhejun Zhang, Peter Karkus, Maximilian Igl, Wenhao Ding,…

July 13, 2025

Putting the Iterative Training of Decision Trees to the Test on a Real-World Robotic Taskby…

July 13, 2025

Measuring Goal-Directednessby Matt MacDermott, James Fox, Francesco Belardinelli, Tom EverittFirst submitted to arxiv on: 6…