Reinforcement learning – Page 42

July 13, 2025

Provably Efficient Exploration in Reward Machines with Low Regretby Hippolyte Bourel, Anders Jonsson, Odalric-Ambrym Maillard,…

July 13, 2025

FFCG: Effective and Fast Family Column Generation for Solving Large-Scale Linear Programby Yi-Xiang Hu, Feng…

July 13, 2025

Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RLby Qin-Wen Luo, Ming-Kun Xie, Ye-Wen…

July 13, 2025

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMsby Junying Chen, Zhenyang Cai, Ke Ji, Xidong Wang,…

July 13, 2025

Constraint-Adaptive Policy Switching for Offline Safe Reinforcement Learningby Yassine Chemingui, Aryan Deshwal, Honghao Wei, Alan…

July 13, 2025

Accelerating AIGC Services with Latent Action Diffusion Scheduling in Edge Networksby Changfu Xu, Jianxiong Guo,…

July 13, 2025

Navigating Data Corruption in Machine Learning: Balancing Quality, Quantity, and Imputation Strategiesby Qi Liu, Wanjing…

July 13, 2025

Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergenceby Yinbin Han, Meisam Razaviyayn, Renyuan…

July 13, 2025

HyperQ-Opt: Q-learning for Hyperparameter Optimizationby Md. Tarek HasanFirst submitted to arxiv on: 23 Dec 2024CategoriesMain:…

July 13, 2025

Active Geospatial Search for Efficient Tenant Eviction Outreachby Anindya Sarkar, Alex DiChristofano, Sanmay Das, Patrick…