Alignment – Page 80 – GrooveSquid.com

July 13, 2025

CREAM: Consistency Regularized Self-Rewarding Language Modelsby Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan…

July 13, 2025

Weak-to-Strong Generalization beyond Accuracy: a Pilot Study in Safety, Toxicity, and Legal Reasoningby Ruimeng Ye,…

July 13, 2025

Revisited Large Language Model for Time Series Analysis through Modality Alignmentby Liangwei Nathan Zheng, Chang…

July 13, 2025

DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMsby Yingsong Luo, Ling ChenFirst submitted to arxiv on:…

July 13, 2025

Preference Optimization with Multi-Sample Comparisonsby Chaoqi Wang, Zhuokai Zhao, Chen Zhu, Karthik Abinav Sankararaman, Michal…

July 13, 2025

Improving Long-Text Alignment for Text-to-Image Diffusion Modelsby Luping Liu, Chao Du, Tianyu Pang, Zehan Wang,…

July 13, 2025

Understanding Likelihood Over-optimisation in Direct Alignment Algorithmsby Zhengyan Shi, Sander Land, Acyr Locatelli, Matthieu Geist,…

July 13, 2025

Data Quality Control in Federated Instruction-tuning of Large Language Modelsby Yaxin Du, Rui Ye, Fengting…

July 13, 2025

FedCCRL: Federated Domain Generalization with Cross-Client Representation Learningby Xinpeng Wang, Yongxin Guo, Xiaoying TangFirst submitted…

July 13, 2025

Tackling Dimensional Collapse toward Comprehensive Universal Domain Adaptationby Hung-Chieh Fang, Po-Yi Lu, Hsuan-Tien LinFirst submitted…