Stochastic gradient descent – Page 2

July 13, 2025

No More Adam: Learning Rate Scaling at Initialization is All You Needby Minghao Xu, Lichuan…

July 13, 2025

A Mapper Algorithm with implicit intervals and its optimizationby Yuyang Tao, Shufei GeFirst submitted to…

July 13, 2025

Explicit and Implicit Graduated Optimization in Deep Neural Networksby Naoki Sato, Hideaki IidukaFirst submitted to…

July 13, 2025

Coupling-based Convergence Diagnostic and Stepsize Scheme for Stochastic Gradient Descentby Xiang Li, Qiaomin XieFirst submitted…

July 13, 2025

Streaming Private Continual Counting via Binningby Joel Daniel Andersson, Rasmus PaghFirst submitted to arxiv on:…

July 13, 2025

A Granger-Causal Perspective on Gradient Descent with Application to Pruningby Aditya Shah, Aditya Challa, Sravan…

July 13, 2025

Online Poisoning Attack Against Reinforcement Learning under Black-box Environmentsby Jianhui Li, Bokang Zhang, Junfeng WuFirst…

July 13, 2025

Training Multi-Layer Binary Neural Networks With Local Binary Error Signalsby Luca Colombo, Fabrizio Pittorino, Manuel…

July 13, 2025

On the Performance Analysis of Momentum Method: A Frequency Domain Perspectiveby Xianliang Li, Jun Luo,…

July 13, 2025

An Approach Towards Learning K-means-friendly Deep Latent Representationby Debapriya RoyFirst submitted to arxiv on: 29…