Optimization – Page 155 – GrooveSquid.com

July 13, 2025

Soft Actor-Critic with Beta Policy via Implicit Reparameterization Gradientsby Luca Della LiberaFirst submitted to arxiv…

July 13, 2025

Notes on Sampled Gaussian Mechanismby Nikita P. KalininFirst submitted to arxiv on: 6 Sep 2024CategoriesMain:…

July 13, 2025

Enhancing Deep Learning with Optimized Gradient Descent: Bridging Numerical Methods and Neural Network Trainingby Yuhan…

July 13, 2025

A Sample Efficient Alternating Minimization-based Algorithm For Robust Phase Retrievalby Adarsh Barik, Anand Krishna, Vincent…

July 13, 2025

Optimization Hyper-parameter Laws for Large Language Modelsby Xingyu Xie, Kuangyu Ding, Shuicheng Yan, Kim-Chuan Toh,…

July 13, 2025

Gaussian-Mixture-Model Q-Functions for Reinforcement Learning by Riemannian Optimizationby Minh Vu, Konstantinos SlavakisFirst submitted to arxiv…

July 13, 2025

Exploiting the Data Gap: Utilizing Non-ignorable Missingness to Manipulate Model Learningby Deniz Koyuncu, Alex Gittens,…

July 13, 2025

Approximating Metric Magnitude of Point Setsby Rayna Andreeva, James Ward, Primoz Skraba, Jie Gao, Rik…

July 13, 2025

Learning to Solve Combinatorial Optimization under Positive Linear Constraints via Non-Autoregressive Neural Networksby Runzhong Wang,…

July 13, 2025

Fast Forwarding Low-Rank Trainingby Adir Rahamim, Naomi Saphra, Sara Kangaslahti, Yonatan BelinkovFirst submitted to arxiv…