Stochastic gradient descent – Page 5

July 13, 2025

Limit Theorems for Stochastic Gradient Descent with Infinite Varianceby Jose Blanchet, Aleksandar Mijatović, Wenhao YangFirst…

July 13, 2025

Implicit Regularization of Sharpness-Aware Minimization for Scale-Invariant Problemsby Bingcong Li, Liang Zhang, Niao HeFirst submitted…

July 13, 2025

Double-Bayesian Learningby Stefan JaegerFirst submitted to arxiv on: 16 Oct 2024CategoriesMain: Machine Learning (cs.LG)Secondary: Neural…

July 13, 2025

Age-of-Gradient Updates for Federated Learning over Random Access Channelsby Yu Heng Wu, Houman Asgari, Stefano…

July 13, 2025

Hessian-Informed Flow Matchingby Christopher Iliffe Sprague, Arne Elofsson, Hossein AzizpourFirst submitted to arxiv on: 15…

July 13, 2025

Non-convergence to global minimizers in data driven supervised deep learning: Adam and stochastic gradient descent…

July 13, 2025

Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late in Trainingby Zhanpeng Zhou, Mingze Wang, Yuchen Mao,…

July 13, 2025

Simultaneous Computation and Memory Efficient Zeroth-Order Optimizer for Fine-Tuning Large Language Modelsby Fei Wang, Li…

July 13, 2025

Learning Orthogonal Multi-Index Models: A Fine-Grained Information Exponent Analysisby Yunwei Ren, Jason D. LeeFirst submitted…

July 13, 2025

Zeroth-Order Fine-Tuning of LLMs in Random Subspacesby Ziming Yu, Pan Zhou, Sike Wang, Jia Li,…