Reinforcement learning – Page 252

July 13, 2025

Mitigating the Alignment Tax of RLHFby Yong Lin, Hangyu Lin, Wei Xiong, Shizhe Diao, Jianmeng…

July 13, 2025

OneNet: Enhancing Time Series Forecasting Models under Concept Drift by Online Ensemblingby Yi-Fan Zhang, Qingsong…

July 13, 2025

Reward-Directed Conditional Diffusion: Provable Distribution Estimation and Reward Improvementby Hui Yuan, Kaixuan Huang, Chengzhuo Ni,…

July 13, 2025

Extracting Diagnosis Pathways from Electronic Health Records Using Deep Reinforcement Learningby Lillian Muyama, Antoine Neuraz,…

July 13, 2025

PAGAR: Taming Reward Misalignment in Inverse Reinforcement Learning-Based Imitation Learning with Protagonist Antagonist Guided Adversarial…

July 13, 2025

Efficient Policy Evaluation with Offline Data Informed Behavior Policy Designby Shuze Liu, Shangtong ZhangFirst submitted…

July 13, 2025

Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learningby Daniel Palenicek, Michael Lutter, Joao…

July 13, 2025

Addressing the issue of stochastic environments and local decision-making in multi-objective reinforcement learningby Kewen DingFirst…

July 13, 2025

Reinforcement Learning for Multi-Truck Vehicle Routing Problemsby Joshua Levin, Randall Correll, Takanori Ide, Takafumi Suzuki,…

July 13, 2025

Semantic and Effective Communication for Remote Control Tasks with Dynamic Feature Compressionby Pietro Talli, Francesco…