Regularization – Page 38 – GrooveSquid.com

July 13, 2025

Hard Prompts Made Interpretable: Sparse Entropy Regularization for Prompt Tuning with RLby Yunseon Choi, Sangmin…

July 13, 2025

Catastrophic Goodhart: regularizing RLHF with KL divergence does not mitigate heavy-tailed reward misspecificationby Thomas Kwa,…

July 13, 2025

OASIS: Conditional Distribution Shaping for Offline Safe Reinforcement Learningby Yihang Yao, Zhepeng Cen, Wenhao Ding,…

July 13, 2025

DisenSemi: Semi-supervised Graph Classification via Disentangled Representation Learningby Yifan Wang, Xiao Luo, Chong Chen, Xian-Sheng…

July 13, 2025

BERTer: The Efficient Oneby Pradyumna Saligram, Andrew LanpouthakounFirst submitted to arxiv on: 19 Jul 2024CategoriesMain:…

July 13, 2025

On the Causal Sufficiency and Necessity of Multi-Modal Representation Learningby Jingyao Wang, Siyu Zhao, Wenwen…

July 13, 2025

Correcting the Mythos of KL-Regularization: Direct Alignment without Overoptimization via Chi-Squared Preference Optimizationby Audrey Huang,…

July 13, 2025

DropKAN: Regularizing KANs by masking post-activationsby Mohammed Ghaith AltarabichiFirst submitted to arxiv on: 17 Jul…

July 13, 2025

Subject-driven Text-to-Image Generation via Preference-based Reinforcement Learningby Yanting Miao, William Loh, Suraj Kothawade, Pascal Poupart,…

July 13, 2025

On the Calibration of Epistemic Uncertainty: Principles, Paradoxes and Conflictual Lossby Mohammed Fellaji, Frédéric Pennerath,…