Reinforcement learning – Page 25

July 13, 2025

Generating and Evolving Reward Functions for Highway Driving with Large Language Modelsby Xu Han, Qiannan…

July 13, 2025

Prompt-Based Length Controlled Generation with Multiple Control Typesby Renlong Jie, Xiaojun Meng, Lifeng Shang, Xin…

July 13, 2025

Sycophancy to Subterfuge: Investigating Reward-Tampering in Large Language Modelsby Carson Denison, Monte MacDiarmid, Fazl Barez,…

July 13, 2025

Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithmsby Miaosen Zhang, Yixuan Wei,…

July 13, 2025

SeMOPO: Learning High-quality Model and Policy from Low-quality Offline Visual Datasetsby Shenghua Wan, Ziyuan Chen,…

July 13, 2025

Multi-agent Reinforcement Learning with Deep Networks for Diverse Q-Vectorsby Zhenglong Luo, Zhiyong Chen, James WelshFirst…

July 13, 2025

EXPIL: Explanatory Predicate Invention for Learning in Gamesby Jingyuan Sha, Hikaru Shindo, Quentin Delfosse, Kristian…

July 13, 2025

Multi-attribute Auction-based Resource Allocation for Twins Migration in Vehicular Metaverses: A GPT-based DRL Approachby Yongju…

July 13, 2025

Diffusion-based Reinforcement Learning for Dynamic UAV-assisted Vehicle Twins Migration in Vehicular Metaversesby Yongju Tong, Jiawen…

July 13, 2025

Knowledge-Infused Legal Wisdom: Navigating LLM Consultation through the Lens of Diagnostics and Positive-Unlabeled Reinforcement Learningby…