Optimization – Page 223 – GrooveSquid.com

July 13, 2025

Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithmsby Rafael Rafailov, Yaswanth Chittepu, Ryan…

July 13, 2025

Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsityby Wentao Guo, Jikai Long, Yimeng Zeng, Zirui Liu,…

July 13, 2025

Quantifying Task Priority for Multi-Task Optimizationby Wooseong Jeong, Kuk-Jin YoonFirst submitted to arxiv on: 5…

July 13, 2025

Adaptive Preference Scaling for Reinforcement Learning with Human Feedbackby Ilgee Hong, Zichong Li, Alexander Bukharin,…

July 13, 2025

Cyclic Sparse Training: Is it Enough?by Advait Gadhikar, Sree Harsha Nelaturu, Rebekka BurkholzFirst submitted to…

July 13, 2025

Building Socially-Equitable Public Modelsby Yejia Liu, Jianyi Yang, Pengfei Li, Tongxin Li, Shaolei RenFirst submitted…

July 13, 2025

Randomized Geometric Algebra Methods for Convex Neural Networksby Yifei Wang, Sungyoon Kim, Paul Chu, Indu…

July 13, 2025

You Only Accept Samples Once: Fast, Self-Correcting Stochastic Variational Inferenceby Dominic B. DaytaFirst submitted to…

July 13, 2025

Combinatorial Optimization with Automated Graph Neural Networksby Yang Liu, Peng Zhang, Yang Gao, Chuan Zhou,…

July 13, 2025

RoutePlacer: An End-to-End Routability-Aware Placer with Graph Neural Networkby Yunbo Hou, Haoran Ye, Yingxue Zhang,…