Alignment – Page 20 – GrooveSquid.com

July 13, 2025

CleanerCLIP: Fine-grained Counterfactual Semantic Augmentation for Backdoor Defense in Contrastive Learningby Yuan Xun, Siyuan Liang,…

July 13, 2025

FactorSim: Generative Simulation via Factorized Representationby Fan-Yun Sun, S. I. Harini, Angela Yi, Yihan Zhou,…

July 13, 2025

Post-hoc Reward Calibration: A Case Study on Length Biasby Zeyu Huang, Zihan Qiu, Zili Wang,…

July 13, 2025

Just Say What You Want: Only-prompting Self-rewarding Online Preference Optimizationby Ruijie Xu, Zhihan Liu, Yongfei…

July 13, 2025

REAL: Response Embedding-based Alignment for LLMsby Honggen Zhang, Xufeng Zhao, Igor Molybog, June ZhangFirst submitted…

July 13, 2025

Holistic Automated Red Teaming for Large Language Models through Top-Down Test Case Generation and Multi-turn…

July 13, 2025

Explaining Human Comparisons using Alignment-Importance Heatmapsby Nhut Truong, Dario Pesenti, Uri HassonFirst submitted to arxiv…

July 13, 2025

Mitigating Semantic Leakage in Cross-lingual Embeddings via Orthogonality Constraintby Dayeon Ki, Cheonbok Park, Hyunjoong KimFirst…

July 13, 2025

StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusingby…

July 13, 2025

TS-HTFA: Advancing Time Series Forecasting via Hierarchical Text-Free Alignment with Large Language Modelsby Pengfei Wang,…