Reinforcement learning from human feedback – Page 5

July 13, 2025

Evidence-Driven Retrieval Augmented Response Generation for Online Misinformationby Zhenrui Yue, Huimin Zeng, Yimeng Lu, Lanyu…

July 13, 2025

MedAide: Leveraging Large Language Models for On-Premise Medical Assistance on Edge Devicesby Abdul Basit, Khizar…

July 13, 2025

Is Crowdsourcing Breaking Your Bank? Cost-Effective Fine-Tuning of Pre-trained Language Models with Proximal Policy Optimizationby…

July 13, 2025

Direct Language Model Alignment from Online AI Feedbackby Shangmin Guo, Biao Zhang, Tianlin Liu, Tianqi…

July 13, 2025

Investigating Bias Representations in Llama 2 Chat via Activation Steeringby Dawn Lu, Nina RimskyFirst submitted…

July 13, 2025

The Language Barrier: Dissecting Safety Challenges of LLMs in Multilingual Contextsby Lingfeng Shen, Weiting Tan,…

July 13, 2025

Reinforcement learning for question answering in programming domain using public community scoring as a human…

July 13, 2025

Comparing Few to Rank Many: Active Human Preference Learning using Randomized Frank-Wolfeby Kiran Koshy Thekumparampil,…

July 13, 2025

Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedbackby Seong Jin Lee, Will Wei Sun, Yufeng…

July 13, 2025

MPPO: Multi Pair-wise Preference Optimization for LLMs with Arbitrary Negative Samplesby Shuo Xie, Fangzhi Zhu,…