RLHF – Page 11 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Calibrating Language Models with Adaptive Temperature Scaling, by Johnathan Xie et al.

Calibrating Language Models with Adaptive Temperature Scalingby Johnathan Xie, Annie S. Chen, Yoonho Lee, Eric…

July 13, 2025

Summary of The Crucial Role Of Samplers in Online Direct Preference Optimization, by Ruizhe Shi et al.

The Crucial Role of Samplers in Online Direct Preference Optimizationby Ruizhe Shi, Runlong Zhou, Simon…

July 13, 2025

Summary of Hybridflow: a Flexible and Efficient Rlhf Framework, by Guangming Sheng et al.

HybridFlow: A Flexible and Efficient RLHF Frameworkby Guangming Sheng, Chi Zhang, Zilingfeng Ye, Xibin Wu,…

July 13, 2025

Summary of Vickreyfeedback: Cost-efficient Data Construction For Reinforcement Learning From Human Feedback, by Guoxi Zhang et al.

VickreyFeedback: Cost-efficient Data Construction for Reinforcement Learning from Human Feedbackby Guoxi Zhang, Jiuding DuanFirst submitted…

July 13, 2025

Summary of Zeroth-order Policy Gradient For Reinforcement Learning From Human Feedback Without Reward Inference, by Qining Zhang et al.

Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inferenceby Qining Zhang, Lei…

July 13, 2025

Summary of Reward-robust Rlhf in Llms, by Yuzi Yan et al.

Reward-Robust RLHF in LLMsby Yuzi Yan, Xingzhou Lou, Jialian Li, Yiping Zhang, Jian Xie, Chao…

July 13, 2025

Summary of Rlhfuse: Efficient Rlhf Training For Large Language Models with Inter- and Intra-stage Fusion, by Yinmin Zhong et al.

RLHFuse: Efficient RLHF Training for Large Language Models with Inter- and Intra-Stage Fusionby Yinmin Zhong,…

July 13, 2025

Summary of From Lists to Emojis: How Format Bias Affects Model Alignment, by Xuanchang Zhang et al.

From Lists to Emojis: How Format Bias Affects Model Alignmentby Xuanchang Zhang, Wei Xiong, Lichang…

July 13, 2025

Summary of Asft: Aligned Supervised Fine-tuning Through Absolute Likelihood, by Ruoyu Wang et al.

ASFT: Aligned Supervised Fine-Tuning through Absolute Likelihoodby Ruoyu Wang, Jiachen Sun, Shaowei Hua, Quan FangFirst…

July 13, 2025

Summary of Quantile Regression For Distributional Reward Models in Rlhf, by Nicolai Dorka

Quantile Regression for Distributional Reward Models in RLHFby Nicolai DorkaFirst submitted to arxiv on: 16…