RLHF – Page 4 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Creativity Has Left the Chat: the Price Of Debiasing Language Models, by Behnam Mohammadi

Creativity Has Left the Chat: The Price of Debiasing Language Modelsby Behnam MohammadiFirst submitted to…

July 13, 2025

Summary of Optimizing Autonomous Driving For Safety: a Human-centric Approach with Llm-enhanced Rlhf, by Yuan Sun et al.

Optimizing Autonomous Driving for Safety: A Human-Centric Approach with LLM-Enhanced RLHFby Yuan Sun, Navid Salami…

July 13, 2025

Summary of Direct Alignment Of Language Models Via Quality-aware Self-refinement, by Runsheng Yu et al.

Direct Alignment of Language Models via Quality-Aware Self-Refinementby Runsheng Yu, Yong Wang, Xiaoqi Jiao, Youzhi…

July 13, 2025

Summary of Instructioncp: a Fast Approach to Transfer Large Language Models Into Target Language, by Kuang-ming Chen et al.

InstructionCP: A fast approach to transfer Large Language Models into target languageby Kuang-Ming Chen, Hung-yi…

July 13, 2025

Summary of Getting More Juice Out Of the Sft Data: Reward Learning From Human Demonstration Improves Sft For Llm Alignment, by Jiaxiang Li et al.

Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT…

July 13, 2025

Summary of Hybrid Preference Optimization: Augmenting Direct Preference Optimization with Auxiliary Objectives, by Anirudhan Badrinath et al.

Hybrid Preference Optimization: Augmenting Direct Preference Optimization with Auxiliary Objectivesby Anirudhan Badrinath, Prabhat Agarwal, Jiajing…

July 13, 2025

Summary of 360zhinao Technical Report, by 360zhinao Team

360Zhinao Technical Reportby 360Zhinao TeamFirst submitted to arxiv on: 22 May 2024CategoriesMain: Computation and Language…

July 13, 2025

Summary of Leveraging Human Revisions For Improving Text-to-layout Models, by Amber Xie et al.

Leveraging Human Revisions for Improving Text-to-Layout Modelsby Amber Xie, Chin-Yi Cheng, Forrest Huang, Yang LiFirst…

July 13, 2025

Summary of More Rlhf, More Trust? on the Impact Of Preference Alignment on Trustworthiness, by Aaron J. Li et al.

More RLHF, More Trust? On The Impact of Preference Alignment On Trustworthinessby Aaron J. Li,…

July 13, 2025

Summary of Mm-phyrlhf: Reinforcement Learning Framework For Multimodal Physics Question-answering, by Janak Kapuriya et al.

MM-PhyRLHF: Reinforcement Learning Framework for Multimodal Physics Question-Answeringby Janak Kapuriya, Chhavi Kirtani, Apoorv Singh, Jay…