Reinforcement learning – Page 105

July 13, 2025

KAN v.s. MLP for Offline Reinforcement Learningby Haihong Guo, Fengxin Li, Jiao Li, Hongyan LiuFirst…

July 13, 2025

Curricula for Learning Robust Policies with Factored State Representations in Changing Environmentsby Panayiotis Panayiotou, Özgür…

July 13, 2025

Quantum-inspired Reinforcement Learning for Synthesizable Drug Designby Dannong Wang, Jintai Chen, Zhiding Liang, Tianfan Fu,…

July 13, 2025

Quasimetric Value Functions with Dense Rewardsby Khadichabonu Valieva, Bikramjit BanerjeeFirst submitted to arxiv on: 13…

July 13, 2025

Batch Ensemble for Variance Dependent Regret in Stochastic Banditsby Asaf Cassel, Orin Levy, Yishay MansourFirst…

July 13, 2025

CPL: Critical Plan Step Learning Boosts LLM Generalization in Reasoning Tasksby Tianlong Wang, Junzhe Chen,…

July 13, 2025

Multi-Model based Federated Learning Against Model Poisoning Attack: A Deep Learning Based Model Selection for…

July 13, 2025

Scores as Actions: a framework of fine-tuning diffusion models by continuous-time reinforcement learningby Hanyang Zhao,…

July 13, 2025

Learning Causally Invariant Reward Functions from Diverse Demonstrationsby Ivan Ovinnikov, Eugene Bykovets, Joachim M. BuhmannFirst…

July 13, 2025

Q-value Regularized Decision ConvFormer for Offline Reinforcement Learningby Teng Yan, Zhendong Ruan, Yaobang Cai, Yu…