Reinforcement learning – Page 164

July 13, 2025

Group Robust Preference Optimization in Reward-free RLHFby Shyam Sundhar Ramesh, Yifan Hu, Iason Chaimalas, Viraj…

July 13, 2025

Linear Function Approximation as a Computationally Efficient Method to Solve Classical Reinforcement Learning Challengesby Hari…

July 13, 2025

Randomized Exploration for Reinforcement Learning with Multinomial Logistic Function Approximationby Wooseong Cho, Taehyun Hwang, Joongkyu…

July 13, 2025

Preference Alignment with Flow Matchingby Minu Kim, Yongsik Lee, Sehyeok Kang, Jihwan Oh, Song Chong,…

July 13, 2025

MetaCURL: Non-stationary Concave Utility Reinforcement Learningby Bianca Marin Moreno, Margaux Brégère, Pierre Gaillard, Nadia OudjaneFirst…

July 13, 2025

Efficient Stimuli Generation using Reinforcement Learning in Design Verificationby Deepak Narayan Gadde, Thomas Nalapat, Aman…

July 13, 2025

Learning from Random Demonstrations: Offline Reinforcement Learning with Importance-Sampled Diffusion Modelsby Zeyu Fang, Tian LanFirst…

July 13, 2025

From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systemsby Jianliang He, Siyu…

July 13, 2025

Fourier Controller Networks for Real-Time Decision-Making in Embodied Learningby Hengkai Tan, Songming Liu, Kai Ma,…

July 13, 2025

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learningby Tenglong Liu, Yang Li, Yixing Lan, Hao…