Gradient descent – Page 6 – GrooveSquid.com

July 13, 2025

Anytime Acceleration of Gradient Descentby Zihan Zhang, Jason D. Lee, Simon S. Du, Yuxin ChenFirst…

July 13, 2025

Transformers are Deep Optimizers: Provable In-Context Learning for Deep Model Trainingby Weimin Wu, Maojiang Su,…

July 13, 2025

Stability properties of gradient flow dynamics for the symmetric low-rank matrix factorization problemby Hesameddin Mohammadi,…

July 13, 2025

Broad Critic Deep Actor Reinforcement Learning for Continuous Controlby Shiron Thalagala, Pak Kin Wong, Xiaozheng…

July 13, 2025

Gradient dynamics for low-rank fine-tuning beyond kernelsby Arif Kerem Dayi, Sitan ChenFirst submitted to arxiv…

July 13, 2025

Applications of fractional calculus in learned optimizationby Teodor Alexandru Szente, James Harrison, Mihai Zanfir, Cristian…

July 13, 2025

Learning Differentiable Surrogate Losses for Structured Predictionby Junjie Yang, Matthieu Labeau, Florence d'Alché-BucFirst submitted to…

July 13, 2025

One-Layer Transformer Provably Learns One-Nearest Neighbor In Contextby Zihao Li, Yuan Cao, Cheng Gao, Yihan…

July 13, 2025

Unraveling the Gradient Descent Dynamics of Transformersby Bingqing Song, Boran Han, Shuai Zhang, Jie Ding,…

July 13, 2025

Non-Adversarial Inverse Reinforcement Learning via Successor Feature Matchingby Arnav Kumar Jain, Harley Wiltzer, Jesse Farebrother,…