RLHF – Page 17 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Mallowspo: Fine-tune Your Llm with Preference Dispersions, by Haoxian Chen et al.

MallowsPO: Fine-Tune Your LLM with Preference Dispersionsby Haoxian Chen, Hanyang Zhao, Henry Lam, David Yao,…

July 13, 2025

Summary of Simpo: Simple Preference Optimization with a Reference-free Reward, by Yu Meng et al.

SimPO: Simple Preference Optimization with a Reference-Free Rewardby Yu Meng, Mengzhou Xia, Danqi ChenFirst submitted…

July 13, 2025

Summary of Dlpo: Diffusion Model Loss-guided Reinforcement Learning For Fine-tuning Text-to-speech Diffusion Models, by Jingyi Chen et al.

DLPO: Diffusion Model Loss-Guided Reinforcement Learning for Fine-Tuning Text-to-Speech Diffusion Modelsby Jingyi Chen, Ju-Seung Byun,…

July 13, 2025

Summary of Online Self-preferring Language Models, by Yuanzhao Zhai et al.

Online Self-Preferring Language Modelsby Yuanzhao Zhai, Zhuo Zhang, Kele Xu, Hanyang Peng, Yue Yu, Dawei…

July 13, 2025

Summary of Lire: Listwise Reward Enhancement For Preference Alignment, by Mingye Zhu et al.

LIRE: listwise reward enhancement for preference alignmentby Mingye Zhu, Yi Liu, Lei Zhang, Junbo Guo,…

July 13, 2025

Summary of A Unified Linear Programming Framework For Offline Reward Learning From Human Demonstrations and Feedback, by Kihyun Kim et al.

A Unified Linear Programming Framework for Offline Reward Learning from Human Demonstrations and Feedbackby Kihyun…

July 13, 2025

Summary of Openrlhf: An Easy-to-use, Scalable and High-performance Rlhf Framework, by Jian Hu et al.

OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Frameworkby Jian Hu, Xibin Wu, Zilin Zhu, Xianyu,…

July 13, 2025

Summary of The Power Of Active Multi-task Learning in Reinforcement Learning From Human Feedback, by Ruitao Chen et al.

The Power of Active Multi-Task Learning in Reinforcement Learning from Human Feedbackby Ruitao Chen, Liwei…

July 13, 2025

Summary of Understanding the Performance Gap Between Online and Offline Alignment Algorithms, by Yunhao Tang et al.

Understanding the performance gap between online and offline alignment algorithmsby Yunhao Tang, Daniel Zhaohan Guo,…

July 13, 2025

Summary of Rlhf Workflow: From Reward Modeling to Online Rlhf, by Hanze Dong et al.

RLHF Workflow: From Reward Modeling to Online RLHFby Hanze Dong, Wei Xiong, Bo Pang, Haoxiang…