Optimization – Page 238 – GrooveSquid.com

July 13, 2025

Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizerby Zhihan Liu,…

July 13, 2025

Diffusion-based Reinforcement Learning via Q-weighted Variational Policy Optimizationby Shutong Ding, Ke Hu, Zhenhao Zhang, Kan…

July 13, 2025

Differentiable Cluster Graph Neural Networkby Yanfei Dong, Mohammed Haroon Dupty, Lambert Deng, Zhuanghua Liu, Yong…

July 13, 2025

Evolutionary Large Language Model for Automated Feature Transformationby Nanxu Gong, Chandan K.Reddy, Wangyang Ying, Haifeng…

July 13, 2025

Negative as Positive: Enhancing Out-of-distribution Generalization for Graph Contrastive Learningby Zixu Wang, Bingbing Xu, Yige…

July 13, 2025

GeoAdaLer: Geometric Insights into Adaptive Stochastic Gradient Descent Algorithmsby Chinedu Eleh, Masuzyo Mwanza, Ekene Aguegboh,…

July 13, 2025

Continuous Temporal Domain Generalizationby Zekun Cai, Guangji Bai, Renhe Jiang, Xuan Song, Liang ZhaoFirst submitted…

July 13, 2025

Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimizationby Zhe Li, Bicheng Ying, Zidong Liu,…

July 13, 2025

A Systematic Bias of Machine Learning Regression Models and Its Correction: an Application to Imaging-based…

July 13, 2025

Wasserstein Distances, Neuronal Entanglement, and Sparsityby Shashata Sawmya, Linghao Kong, Ilia Markov, Dan Alistarh, Nir…