Supervised – Page 48 – GrooveSquid.com

July 13, 2025

On The Global Convergence Of Online RLHF With Neural Parametrizationby Mudit Gaur, Amrit Singh Bedi,…

July 13, 2025

Mitigating Forgetting in LLM Supervised Fine-Tuning and Preference Learningby Heshan Fernando, Han Shen, Parikshit Ram,…

July 13, 2025

On Designing Effective RL Reward at Training Time for LLM Reasoningby Jiaxuan Gao, Shusheng Xu,…

July 13, 2025

Weakly-supervised diagnosis identification from Italian discharge lettersby Vittorio Torri, Elisa Barbieri, Anna Cantarutti, Carlo Giaquinto,…

July 13, 2025

Baichuan Alignment Technical Reportby Mingan Lin, Fan Yang, Yanjun Shen, Haoze Sun, Tianpeng Li, Tao…

July 13, 2025

Large Language Models Are Overparameterized Text Encodersby Thennal D K, Tim Fischer, Chris BiemannFirst submitted…

July 13, 2025

Electrocardiogram-Language Model for Few-Shot Question Answering with Meta Learningby Jialu Tang, Tong Xia, Yuan Lu,…

July 13, 2025

G-NeuroDAVIS: A Neural Network model for generalized embedding, data visualization and sample generationby Chayan Maitra,…

July 13, 2025

RAZOR: Refining Accuracy by Zeroing Out Redundanciesby Daniel Riccio, Genoveffa Tortora, Mara SangiovanniFirst submitted to…

July 13, 2025

A Statistical Machine Learning Approach for Adapting Reduced-Order Models using Projected Gaussian Processby Xiao Liu,…