Reinforcement learning – Page 139

July 13, 2025

Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraintsby Jianuo HuangFirst submitted to arxiv…

July 13, 2025

Disentangled Representations for Causal Cognitionby Filippo Torresan, Manuel BaltieriFirst submitted to arxiv on: 30 Jun…

July 13, 2025

A Two-stage Reinforcement Learning-based Approach for Multi-entity Task Allocationby Aicheng Gong, Kai Yang, Jiafei Lyu,…

July 13, 2025

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learningby Yuheng Zhang, Dian…

July 13, 2025

PUZZLES: A Benchmark for Neural Algorithmic Reasoningby Benjamin Estermann, Luca A. Lanzendörfer, Yannick Niedermayr, Roger…

July 13, 2025

A Bayesian Solution To The Imitation Gapby Risto Vuorio, Mattie Fellows, Cong Lu, Clémence Grislain,…

July 13, 2025

Tradeoffs When Considering Deep Reinforcement Learning for Contingency Management in Advanced Air Mobilityby Luis E.…

July 13, 2025

External Model Motivated Agents: Reinforcement Learning for Enhanced Environment Samplingby Rishav Bhagat, Jonathan Balloch, Zhiyu…

July 13, 2025

ARES: Alternating Reinforcement Learning and Supervised Fine-Tuning for Enhanced Multi-Modal Chain-of-Thought Reasoning Through Diverse AI…

July 13, 2025

Instance Temperature Knowledge Distillationby Zhengbo Zhang, Yuxi Zhou, Jia Gong, Jun Liu, Zhigang TuFirst submitted…