Reinforcement learning – Page 169

July 13, 2025

Large Language Model-Driven Curriculum Design for Mobile Networksby Omar Erak, Omar Alhussein, Shimaa Naser, Nouf…

July 13, 2025

Mollification Effects of Policy Gradient Methodsby Tao Wang, Sylvia Herbert, Sicun GaoFirst submitted to arxiv…

July 13, 2025

OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimatorsby Allen Nie, Yash Chandak,…

July 13, 2025

ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modelingby Chenyu Huang, Zhengyang…

July 13, 2025

Rethinking Pruning for Backdoor Mitigation: An Optimization Perspectiveby Nan Li, Haiyang Yu, Ping YiFirst submitted…

July 13, 2025

Offline Oracle-Efficient Learning for Contextual MDPs via Layerwise Exploration-Exploitation Tradeoffby Jian Qian, Haichen Hu, David…

July 13, 2025

Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulationby Ignat Georgiev, Krishnan Srinivasan, Jie…

July 13, 2025

Matrix Low-Rank Trust Region Policy Optimizationby Sergio Rozada, Antonio G. MarquesFirst submitted to arxiv on:…

July 13, 2025

Symmetric Reinforcement Learning Loss for Robust Learning on Diverse Tasks and Model Scalesby Ju-Seung Byun,…

July 13, 2025

Matrix Low-Rank Approximation For Policy Gradient Methodsby Sergio Rozada, Antonio G. MarquesFirst submitted to arxiv…