Reinforcement learning – Page 155

July 13, 2025

Online Policy Distillation with Decision-Attentionby Xinqiang Yu, Chuanguang Yang, Chengqing Yu, Libo Huang, Zhulin An,…

July 13, 2025

Reinforcement Learning for Intensity Control: An Application to Choice-Based Network Revenue Managementby Huiling Meng, Ningyuan…

July 13, 2025

Massively Multiagent Minigames for Training Generalist Agentsby Kyoung Whan Choe, Ryan Sullivan, Joseph SuárezFirst submitted…

July 13, 2025

Optimizing Automatic Differentiation with Deep Reinforcement Learningby Jamie Lohoff, Emre NeftciFirst submitted to arxiv on:…

July 13, 2025

Skill-aware Mutual Information Optimisation for Generalisation in Reinforcement Learningby Xuehui Yu, Mhairi Dunion, Xin Li,…

July 13, 2025

Primitive Agentic First-Order Optimizationby R. SalaFirst submitted to arxiv on: 7 Jun 2024CategoriesMain: Machine Learning…

July 13, 2025

Stabilizing Extreme Q-learning by Maclaurin Expansionby Motoki Omura, Takayuki Osa, Yusuke Mukuta, Tatsuya HaradaFirst submitted…

July 13, 2025

On Minimizing Adversarial Counterfactual Error in Adversarial RLby Roman Belaire, Arunesh Sinha, Pradeep VarakanthamFirst submitted…

July 13, 2025

Reinforcement Learning and Regret Bounds for Admission Controlby Lucas Weber, Ana Bušić, Jiamin ZhuFirst submitted…

July 13, 2025

Optimization of geological carbon storage operations with multimodal latent dynamic model and deep reinforcement learningby…