Alignment – Page 34 – GrooveSquid.com

July 13, 2025

Code-Switching Red-Teaming: LLM Evaluation for Safety and Multilingual Understandingby Haneul Yoo, Yongjin Yang, Hwaran LeeFirst…

July 13, 2025

PKU-SafeRLHF: Towards Multi-Level Safety Alignment for LLMs with Human Preferenceby Jiaming Ji, Donghai Hong, Borong…

July 13, 2025

Identifying and Solving Conditional Image Leakage in Image-to-Video Diffusion Modelby Min Zhao, Hongzhou Zhu, Chendong…

July 13, 2025

Safe Inputs but Unsafe Output: Benchmarking Cross-modality Safety Alignment of Large Vision-Language Modelby Siyin Wang,…

July 13, 2025

Camera-Invariant Meta-Learning Network for Single-Camera-Training Person Re-identificationby Jiangbo Pei, Zhuqing Jiang, Aidong Men, Haiying Wang,…

July 13, 2025

GIEBench: Towards Holistic Evaluation of Group Identity-based Empathy for Large Language Modelsby Leyan Wang, Yonggang…

July 13, 2025

Artificial Leviathan: Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract…

July 13, 2025

SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Datasetby Josef Dai, Tianle…

July 13, 2025

GenderAlign: An Alignment Dataset for Mitigating Gender Bias in Large Language Modelsby Tao Zhang, Ziqian…

July 13, 2025

ViLCo-Bench: VIdeo Language COntinual learning Benchmarkby Tianqi Tang, Shohreh Deldari, Hao Xue, Celso De Melo,…