Generalization – Page 197 – GrooveSquid.com

July 13, 2025

Asymptotics of feature learning in two-layer networks after one gradient-stepby Hugo Cui, Luca Pesce, Yatin…

July 13, 2025

Strong convexity-guided hyper-parameter optimization for flatter lossesby Rahul Yedida, Snehanshu SahaFirst submitted to arxiv on:…

July 13, 2025

Tighter Generalisation Bounds via Interpolationby Paul Viallard, Maxime Haddouche, Umut Şimşekli, Benjamin GuedjFirst submitted to…

July 13, 2025

Explaining Learned Reward Functions with Counterfactual Trajectoriesby Jan Wehner, Frans Oliehoek, Luciano Cavalcante SiebertFirst submitted…

July 13, 2025

CodeIt: Self-Improving Language Models with Prioritized Hindsight Replayby Natasha Butt, Blazej Manczak, Auke Wiggers, Corrado…

July 13, 2025

On Provable Length and Compositional Generalizationby Kartik Ahuja, Amin MansouriFirst submitted to arxiv on: 7…

July 13, 2025

Group Distributionally Robust Dataset Distillation with Risk Minimizationby Saeed Vahidian, Mingyu Wang, Jianyang Gu, Vyacheslav…

July 13, 2025

LEVI: Generalizable Fine-tuning via Layer-wise Ensemble of Different Viewsby Yuji Roh, Qingyun Liu, Huan Gui,…

July 13, 2025

Amortized Planning with Large-Scale Transformers: A Case Study on Chessby Anian Ruoss, Grégoire Delétang, Sourabh…

July 13, 2025

PRES: Toward Scalable Memory-Based Dynamic Graph Neural Networksby Junwei Su, Difan Zou, Chuan WuFirst submitted…