Generalization – Page 153 – GrooveSquid.com

July 13, 2025

Dissecting the Interplay of Attention Paths in a Statistical Mechanics Theory of Transformersby Lorenzo Tiberi,…

July 13, 2025

Score-based generative models are provably robust: an uncertainty quantification perspectiveby Nikiforos Mimikos-Stamatopoulos, Benjamin J. Zhang,…

July 13, 2025

Filtered Corpus Training (FiCT) Shows that Language Models can Generalize from Indirect Evidenceby Abhinav Patil,…

July 13, 2025

Reinforcing Language Agents via Policy Optimization with Action Decompositionby Muning Wen, Ziyu Wan, Weinan Zhang,…

July 13, 2025

Dimension-free deterministic equivalents and scaling laws for random feature regressionby Leonardo Defilippis, Bruno Loureiro, Theodor…

July 13, 2025

Information-theoretic Generalization Analysis for Expected Calibration Errorby Futoshi Futami, Masahiro FujisawaFirst submitted to arxiv on:…

July 13, 2025

A generalized neural tangent kernel for surrogate gradient learningby Luke Eilers, Raoul-Martin Memmesheimer, Sven GoedekeFirst…

July 13, 2025

Unlearning Concepts in Diffusion Model via Concept Domain Correction and Concept Preserving Gradientby Yongliang Wu,…

July 13, 2025

NuwaTS: a Foundation Model Mending Every Incomplete Time Seriesby Jinguo Cheng, Chunwei Yang, Wanlin Cai,…

July 13, 2025

Reshuffling Resampling Splits Can Improve Generalization of Hyperparameter Optimizationby Thomas Nagler, Lennart Schneider, Bernd Bischl,…