Generalization – Page 69 – GrooveSquid.com

July 13, 2025

Unlocking the Theory Behind Scaling 1-Bit Neural Networksby Majid Daliri, Zhao Song, Chiwun YangFirst submitted…

July 13, 2025

Rethinking Weight Decay for Robust Fine-Tuning of Foundation Modelsby Junjiao Tian, Chengyue Huang, Zsolt KiraFirst…

July 13, 2025

A General Recipe for Contractive Graph Neural Networks – Technical Reportby Maya Bechler-Speicher, Moshe EliasofFirst…

July 13, 2025

1st-Order Magic: Analysis of Sharpness-Aware Minimizationby Nalin Tiwary, Siddarth AananthFirst submitted to arxiv on: 3…

July 13, 2025

Online Relational Inference for Evolving Multi-agent Interacting Systemsby Beomseok Kang, Priyabrata Saha, Sudarshan Sharma, Biswadeep…

July 13, 2025

FEED: Fairness-Enhanced Meta-Learning for Domain Generalizationby Kai Jiang, Chen Zhao, Haoliang Wang, Feng ChenFirst submitted…

July 13, 2025

HG-Adapter: Improving Pre-Trained Heterogeneous Graph Neural Networks with Dual Adaptersby Yujie Mo, Runpeng Yu, Xiaofeng…

July 13, 2025

Provable Length Generalization in Sequence Prediction via Spectral Filteringby Annie Marsden, Evan Dogariu, Naman Agarwal,…

July 13, 2025

BACSA: A Bias-Aware Client Selection Algorithm for Privacy-Preserving Federated Learning in Wireless Healthcare Networksby Sushilkumar…

July 13, 2025

Fighting Spurious Correlations in Text Classification via a Causal Learning Perspectiveby Yuqing Zhou, Ziwei ZhuFirst…