Regularization – Page 20 – GrooveSquid.com

July 13, 2025

Magnitude Pruning of Large Pretrained Transformer Models with a Mixture Gaussian Priorby Mingxuan Zhang, Yan…

July 13, 2025

Automated Global Analysis of Experimental Dynamics through Low-Dimensional Linear Embeddingsby Samuel A. Moore, Brian P.…

July 13, 2025

Preventing Model Collapse in Deep Canonical Correlation Analysis by Noise Regularizationby Junlin He, Jinxiao Du,…

July 13, 2025

Preventing Dimensional Collapse in Self-Supervised Learning via Orthogonality Regularizationby Junlin He, Jinxiao Du, Wei MaFirst…

July 13, 2025

Improving Few-Shot Cross-Domain Named Entity Recognition by Instruction Tuning a Word-Embedding based Retrieval Augmented Large…

July 13, 2025

Understanding Optimization in Deep Learning with Central Flowsby Jeremy M. Cohen, Alex Damian, Ameet Talwalkar,…

July 13, 2025

Weight decay induces low-rank attention layersby Seijin Kobayashi, Yassir Akram, Johannes Von OswaldFirst submitted to…

July 13, 2025

Global Convergence in Training Large-Scale Transformersby Cheng Gao, Yuan Cao, Zihao Li, Yihan He, Mengdi…

July 13, 2025

A Monte Carlo Framework for Calibrated Uncertainty Estimation in Sequence Predictionby Qidong Yang, Weicheng Zhu,…

July 13, 2025

Sequential Order-Robust Mamba for Time Series Forecastingby Seunghan Lee, Juri Hong, Kibok Lee, Taeyoung ParkFirst…