Optimization – Page 45 – GrooveSquid.com

July 13, 2025

Regularized Best-of-N Sampling with Minimum Bayes Risk Objective for Language Model Alignmentby Yuu Jinnai, Tetsuro…

July 13, 2025

Configurable Safety Tuning of Language Models with Synthetic Preference Databy Victor GallegoFirst submitted to arxiv…

July 13, 2025

Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstructionby Qiuhong Shen, Zike Wu,…

July 13, 2025

Improving Attributed Text Generation of Large Language Models via Preference Learningby Dongfang Li, Zetian Sun,…

July 13, 2025

Prioritized League Reinforcement Learning for Large-Scale Heterogeneous Multiagent Systemsby Qingxu Fu, Zhiqiang Pu, Min Chen,…

July 13, 2025

Towards a FAIR Documentation of Workflows and Models in Applied Mathematicsby Marco Reidelbach, Björn Schembera,…

July 13, 2025

InternLM2 Technical Reportby Zheng Cai, Maosong Cao, Haojiong Chen, Kai Chen, Keyu Chen, Xin Chen,…

July 13, 2025

Learning Traffic Signal Control via Genetic Programmingby Xiao-Cheng Liao, Yi Mei, Mengjie ZhangFirst submitted to…

July 13, 2025

Explainable Graph Neural Networks for Observation Impact Analysis in Atmospheric State Estimationby Hyeon-Ju Jeon, Jeon-Ho…

July 13, 2025

An Open-source End-to-End Logic Optimization Framework for Large-scale Boolean Network with Reinforcement Learningby Zhen Li,…