Reinforcement learning – Page 154

July 13, 2025

Summary of Verification-guided Shielding For Deep Reinforcement Learning, by Davide Corsi et al.

Verification-Guided Shielding for Deep Reinforcement Learningby Davide Corsi, Guy Amir, Andoni Rodriguez, Cesar Sanchez, Guy…

July 13, 2025

Summary of Is Value Functions Estimation with Classification Plug-and-play For Offline Reinforcement Learning?, by Denis Tarasov et al.

Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning?by Denis Tarasov, Kirill Brilliantov,…

July 13, 2025

Summary of Deep Multi-objective Reinforcement Learning For Utility-based Infrastructural Maintenance Optimization, by Jesse Van Remmerden et al.

Deep Multi-Objective Reinforcement Learning for Utility-Based Infrastructural Maintenance Optimizationby Jesse van Remmerden, Maurice Kenter, Diederik…

July 13, 2025

Summary of Decoupling Regularization From the Action Space, by Sobhan Mohammadpour et al.

Decoupling regularization from the action spaceby Sobhan Mohammadpour, Emma Frejinger, Pierre-Luc BaconFirst submitted to arxiv…

July 13, 2025

Summary of Discovering Multiple Solutions From a Single Task in Offline Reinforcement Learning, by Takayuki Osa and Tatsuya Harada

Discovering Multiple Solutions from a Single Task in Offline Reinforcement Learningby Takayuki Osa, Tatsuya HaradaFirst…

July 13, 2025

Summary of Investigating Pre-training Objectives For Generalization in Vision-based Reinforcement Learning, by Donghu Kim et al.

Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learningby Donghu Kim, Hojoon Lee, Kyungmin Lee,…

July 13, 2025

Summary of Starling: Self-supervised Training Of Text-based Reinforcement Learning Agent with Large Language Models, by Shreyas Basavatia et al.

STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language Modelsby Shreyas Basavatia, Keerthiram…

July 13, 2025

Summary of Lgr2: Language Guided Reward Relabeling For Accelerating Hierarchical Reinforcement Learning, by Utsav Singh et al.

LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learningby Utsav Singh, Pramit Bhattacharyya, Vinay…

July 13, 2025

Summary of Icu-sepsis: a Benchmark Mdp Built From Real Medical Data, by Kartik Choudhary et al.

ICU-Sepsis: A Benchmark MDP Built from Real Medical Databy Kartik Choudhary, Dhawal Gupta, Philip S.…

July 13, 2025

Summary of Decision Mamba: a Multi-grained State Space Model with Self-evolution Regularization For Offline Rl, by Qi Lv et al.

Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RLby Qi Lv,…