Optimization – Page 92 – GrooveSquid.com

July 13, 2025

Entropy Controllable Direct Preference Optimizationby Motoki Omura, Yasuhiro Fujita, Toshiki KataokaFirst submitted to arxiv on:…

July 13, 2025

Exploring Multi-Agent Reinforcement Learning for Unrelated Parallel Machine Schedulingby Maria Zampella, Urtzi Otamendi, Xabier Belaunzaran,…

July 13, 2025

Efficient Adaptive Optimization via Subset-Norm and Subspace-Momentum: Fast, Memory-Reduced Training with Convergence Guaranteesby Thien Hang…

July 13, 2025

WassFFed: Wasserstein Fair Federated Learningby Zhongxuan Han, Li Zhang, Chaochao Chen, Xiaolin Zheng, Fei Zheng,…

July 13, 2025

Non-Adversarial Inverse Reinforcement Learning via Successor Feature Matchingby Arnav Kumar Jain, Harley Wiltzer, Jesse Farebrother,…

July 13, 2025

General framework for online-to-nonconvex conversion: Schedule-free SGD is also effective for nonconvex optimizationby Kwangjun Ahn,…

July 13, 2025

Scientific machine learning in ecological systems: A study on the predator-prey dynamicsby Ranabir Devgupta, Raj…

July 13, 2025

Neuromodulated Meta-Learningby Jingyao Wang, Huijie Guo, Wenwen Qiang, Jiangmeng Li, Changwen Zheng, Hui Xiong, Gang…

July 13, 2025

Meta-Learning Objectives for Preference Optimizationby Carlo Alfano, Silvia Sapora, Jakob Nicolaus Foerster, Patrick Rebeschini, Yee…

July 13, 2025

An Energy-Based Self-Adaptive Learning Rate for Stochastic Gradient Descent: Enhancing Unconstrained Optimization with VAV methodby…