Optimization – Page 132 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Understanding Warmup-stable-decay Learning Rates: a River Valley Loss Landscape Perspective, by Kaiyue Wen et al.

Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspectiveby Kaiyue Wen, Zhiyuan Li, Jason…

July 13, 2025

Summary of Seppo: Semi-policy Preference Optimization For Diffusion Alignment, by Daoan Zhang et al.

SePPO: Semi-Policy Preference Optimization for Diffusion Alignmentby Daoan Zhang, Guangchen Lan, Dong-Jun Han, Wenlin Yao,…

July 13, 2025

Summary of Sparsepo: Controlling Preference Alignment Of Llms Via Sparse Token Masks, by Fenia Christopoulou et al.

SparsePO: Controlling Preference Alignment of LLMs via Sparse Token Masksby Fenia Christopoulou, Ronald Cardenas, Gerasimos…

July 13, 2025

Summary of Tuning-free Bilevel Optimization: New Algorithms and Convergence Analysis, by Yifan Yang et al.

Tuning-Free Bilevel Optimization: New Algorithms and Convergence Analysisby Yifan Yang, Hao Ban, Minhui Huang, Shiqian…

July 13, 2025

Summary of A Simulation-free Deep Learning Approach to Stochastic Optimal Control, by Mengjian Hua et al.

A Simulation-Free Deep Learning Approach to Stochastic Optimal Controlby Mengjian Hua, Matthieu Laurière, Eric Vanden-EijndenFirst…

July 13, 2025

Summary of Taming Gradient Oversmoothing and Expansion in Graph Neural Networks, by Moonjeong Park et al.

Taming Gradient Oversmoothing and Expansion in Graph Neural Networksby MoonJeong Park, Dongwoo KimFirst submitted to…

July 13, 2025

Summary of On the Optimization and Generalization Of Two-layer Transformers with Sign Gradient Descent, by Bingrui Li et al.

On the Optimization and Generalization of Two-layer Transformers with Sign Gradient Descentby Bingrui Li, Wei…

July 13, 2025

Summary of Improver: Agent-based Automated Proof Optimization, by Riyaz Ahuja et al.

ImProver: Agent-Based Automated Proof Optimizationby Riyaz Ahuja, Jeremy Avigad, Prasad Tetali, Sean WelleckFirst submitted to…

July 13, 2025

Summary of Fast Training Of Sinusoidal Neural Fields Via Scaling Initialization, by Taesun Yeom et al.

Fast Training of Sinusoidal Neural Fields via Scaling Initializationby Taesun Yeom, Sangyoon Lee, Jaeho LeeFirst…

July 13, 2025

Summary of Regressing the Relative Future: Efficient Policy Optimization For Multi-turn Rlhf, by Zhaolin Gao et al.

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHFby Zhaolin Gao, Wenhao Zhan, Jonathan…