Reinforcement learning – Page 144

July 13, 2025

Summary of Kalmamba: Towards Efficient Probabilistic State Space Models For Rl Under Uncertainty, by Philipp Becker et al.

KalMamba: Towards Efficient Probabilistic State Space Models for RL under Uncertaintyby Philipp Becker, Niklas Freymuth,…

July 13, 2025

Summary of Open Problem: Order Optimal Regret Bounds For Kernel-based Reinforcement Learning, by Sattar Vakili

Open Problem: Order Optimal Regret Bounds for Kernel-Based Reinforcement Learningby Sattar VakiliFirst submitted to arxiv…

July 13, 2025

Summary of An Idiosyncrasy Of Time-discretization in Reinforcement Learning, by Kris De Asis et al.

An Idiosyncrasy of Time-discretization in Reinforcement Learningby Kris De Asis, Richard S. SuttonFirst submitted to…

July 13, 2025

Summary of Sit: Symmetry-invariant Transformers For Generalisation in Reinforcement Learning, by Matthias Weissenbacher et al.

SiT: Symmetry-Invariant Transformers for Generalisation in Reinforcement Learningby Matthias Weissenbacher, Rishabh Agarwal, Yoshinobu KawaharaFirst submitted…

July 13, 2025

Summary of Rl on Incorrect Synthetic Data Scales the Efficiency Of Llm Math Reasoning by Eight-fold, By Amrith Setlur et al.

RL on Incorrect Synthetic Data Scales the Efficiency of LLM Math Reasoning by Eight-Foldby Amrith…

July 13, 2025

Summary of Macrohft: Memory Augmented Context-aware Reinforcement Learning on High Frequency Trading, by Chuqiao Zong et al.

MacroHFT: Memory Augmented Context-aware Reinforcement Learning On High Frequency Tradingby Chuqiao Zong, Chaojie Wang, Molei…

Summary of Kalmamba: Towards Efficient Probabilistic State Space Models For Rl Under Uncertainty, by Philipp Becker et al.

Summary of Open Problem: Order Optimal Regret Bounds For Kernel-based Reinforcement Learning, by Sattar Vakili

Summary of An Idiosyncrasy Of Time-discretization in Reinforcement Learning, by Kris De Asis et al.

Summary of Sit: Symmetry-invariant Transformers For Generalisation in Reinforcement Learning, by Matthias Weissenbacher et al.

Summary of Behaviour Distillation, by Andrei Lupu et al.

Summary of Direct Multi-turn Preference Optimization For Language Agents, by Wentao Shi et al.

Summary of A Benchmark Study Of Deep-rl Methods For Maximum Coverage Problems Over Graphs, by Zhicheng Liang et al.

Summary of A General Control-theoretic Approach For Reinforcement Learning: Theory and Algorithms, by Weiqin Chen et al.

Summary of Rl on Incorrect Synthetic Data Scales the Efficiency Of Llm Math Reasoning by Eight-fold, By Amrith Setlur et al.

Summary of Macrohft: Memory Augmented Context-aware Reinforcement Learning on High Frequency Trading, by Chuqiao Zong et al.