Alignment – Page 113 – GrooveSquid.com

July 13, 2025

Preference Learning Algorithms Do Not Learn Preference Rankingsby Angelica Chen, Sadhika Malladi, Lily H. Zhang,…

July 13, 2025

CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learningby Yiping Wang, Yifang Chen, Wendan…

July 13, 2025

Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Groundingby Shenghuan Sun, Alexander Schubert, Gregory M. Goldgof,…

July 13, 2025

Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHFby Shicong Cen, Jincheng Mei,…

July 13, 2025

Self-Exploring Language Models: Active Preference Elicitation for Online Alignmentby Shenao Zhang, Donghan Yu, Hiteshi Sharma,…

July 13, 2025

X-VILA: Cross-Modality Alignment for Large Language Modelby Hanrong Ye, De-An Huang, Yao Lu, Zhiding Yu,…

July 13, 2025

Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Modelsby Zhanhui Zhou, Zhixuan…

July 13, 2025

Inference-Time Alignment of Diffusion Models with Direct Noise Optimizationby Zhiwei Tang, Jiangweizhi Peng, Jiasheng Tang,…

July 13, 2025

Lisa: Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning Attackby Tiansheng Huang, Sihao…

July 13, 2025

It’s Not a Modality Gap: Characterizing and Addressing the Contrastive Gapby Abrar Fahim, Alex Murphy,…