Alignment – Page 72 – GrooveSquid.com

July 13, 2025

Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignmentby Jason Vega, Junsheng Huang,…

July 13, 2025

Dissecting the Failure of Invariant Learning on Graphsby Qixun Wang, Yifei Wang, Yisen Wang, Xianghua…

July 13, 2025

Enhancing Adversarial Robustness via Uncertainty-Aware Distributional Adversarial Trainingby Junhao Dong, Xinghua Qu, Z. Jane Wang,…

July 13, 2025

Collective Model Intelligence Requires Compatible Specializationby Jyothish Pari, Samy Jelassi, Pulkit AgrawalFirst submitted to arxiv…

July 13, 2025

Generalizable and Robust Spectral Method for Multi-view Representation Learningby Amitai Yacobi, Ofir Lindenbaum, Uri ShahamFirst…

July 13, 2025

Sample-Efficient Alignment for LLMsby Zichen Liu, Changyu Chen, Chao Du, Wee Sun Lee, Min LinFirst…

July 13, 2025

Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignmentby Chengting Yu, Fengzhao Zhang, Ruizhe…

July 13, 2025

Multi-Channel Hypergraph Contrastive Learning for Matrix Completionby Xiang Li, Changsheng Shui, Yanwei Yu, Chao Huang,…

July 13, 2025

Sentiment Analysis Based on RoBERTa for Amazon Review: An Empirical Study on Decision Makingby Xinli…

July 13, 2025

EF-LLM: Energy Forecasting LLM with AI-assisted Automation, Enhanced Sparse Prediction, Hallucination Detectionby Zihang Qiu, Chaojie…