Reinforcement learning – Page 174

July 13, 2025

Cross-Domain Policy Adaptation by Capturing Representation Mismatchby Jiafei Lyu, Chenjia Bai, Jingwen Yang, Zongqing Lu,…

July 13, 2025

Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rateby Fan-Ming Luo, Zuolin Tu, Zefang Huang,…

July 13, 2025

iVideoGPT: Interactive VideoGPTs are Scalable World Modelsby Jialong Wu, Shaofeng Yin, Ningya Feng, Xu He,…

July 13, 2025

Cooperative Backdoor Attack in Decentralized Reinforcement Learning with Theoretical Guaranteeby Mengtong Gao, Yifei Zou, Zuyuan…

July 13, 2025

Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Modelsby Cong Lu, Shengran Hu, Jeff…

July 13, 2025

Diffusion Actor-Critic with Entropy Regulatorby Yinuo Wang, Likun Wang, Yuxuan Jiang, Wenjun Zou, Tong Liu,…

July 13, 2025

Extracting Heuristics from Large Language Models for Reward Shaping in Reinforcement Learningby Siddhant Bhambri, Amrita…

July 13, 2025

Reinforcement Learning for Infinite-Horizon Average-Reward Linear MDPs via Approximation by Discounted-Reward MDPsby Kihyuk Hong, Woojin…

July 13, 2025

MallowsPO: Fine-Tune Your LLM with Preference Dispersionsby Haoxian Chen, Hanyang Zhao, Henry Lam, David Yao,…

July 13, 2025

Interpretable and Editable Programmatic Tree Policies for Reinforcement Learningby Hector Kohler, Quentin Delfosse, Riad Akrour,…