Alignment – Page 52 – GrooveSquid.com

July 13, 2025

Don’t Forget Your Reward Values: Language Model Alignment via Value-based Calibrationby Xin Mao, Feng-Lin Li,…

July 13, 2025

COBIAS: Contextual Reliability in Bias Assessmentby Priyanshul Govil, Hemang Jain, Vamshi Krishna Bonagiri, Aman Chadha,…

July 13, 2025

Unlocking the Power of Large Language Models for Entity Alignmentby Xuhui Jiang, Yinghan Shen, Zhichao…

July 13, 2025

MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialoguesby Ge Bai, Jie…

July 13, 2025

Towards Robust Instruction Tuning on Multimodal Large Language Modelsby Wei Han, Hui Chen, Soujanya PoriaFirst…

July 13, 2025

SYNFAC-EDIT: Synthetic Imitation Edit Feedback for Factual Alignment in Clinical Summarizationby Prakamya Mishra, Zonghai Yao,…

July 13, 2025

CausalGym: Benchmarking causal interpretability methods on linguistic tasksby Aryaman Arora, Dan Jurafsky, Christopher PottsFirst submitted…

July 13, 2025

Incentive Compatibility for AI Alignment in Sociotechnical Systems: Positions and Prospectsby Zhaowei Zhang, Fengshuo Bai,…

July 13, 2025

Transformer-based Causal Language Models Perform Clusteringby Xinbo Wu, Lav R. VarshneyFirst submitted to arxiv on:…

July 13, 2025

The Revolution of Multimodal Large Language Models: A Surveyby Davide Caffagni, Federico Cocchi, Luca Barsellotti,…