Reinforcement learning from human feedback – Page 2

July 13, 2025

Improving Small-Scale Large Language Models Function Calling for Reasoning Tasksby Graziano A. Manduzio, Federico A.…

July 13, 2025

Reversal of Thought: Enhancing Large Language Models with Preference-Guided Reverse Reasoning Warm-upby Jiahao Yuan, Dehui…

July 13, 2025

Increasing the Difficulty of Automatically Generated Questions via Reinforcement Learning with Synthetic Preferenceby William Thorne,…

July 13, 2025

The Accuracy Paradox in RLHF: When Better Reward Models Don’t Yield Better Language Modelsby Yanjun…

July 13, 2025

CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoningby Huimu Yu, Xing Wu, Weidong…

July 13, 2025

Seeing Eye to AI: Human Alignment via Gaze-Based Response Rewards for Large Language Modelsby Angela…

July 13, 2025

The Phenomenology of Machine: A Comprehensive Analysis of the Sentience of the OpenAI-o1 Model Integrating…

July 13, 2025

Post-hoc Reward Calibration: A Case Study on Length Biasby Zeyu Huang, Zihan Qiu, Zili Wang,…

July 13, 2025

Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimizationby Ruijie Xu, Zhihan Liu, Yongfei…

July 13, 2025

PatentGPT: A Large Language Model for Patent Drafting Using Knowledge-based Fine-tuning Methodby Runtao Ren, Jian…