Alignment – Page 83 – GrooveSquid.com

July 13, 2025

Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Predictionby Jarrid Rector-Brooks, Mohsin Hasan, Zhangzhi…

July 13, 2025

Reward-Augmented Data Enhances Direct Preference Alignment of LLMsby Shenao Zhang, Zhihan Liu, Boyi Liu, Yufeng…

July 13, 2025

Unstable Unlearning: The Hidden Risk of Concept Resurgence in Diffusion Modelsby Vinith M. Suriyakumar, Rohan…

July 13, 2025

SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selectionby Han Shen, Pin-Yu Chen, Payel Das,…

July 13, 2025

Degree Distribution based Spiking Graph Networks for Domain Adaptationby Yingxu Wang, Mengzhu Wang, Siwei Liu,…

July 13, 2025

Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Thinkby Sihyun Yu, Sangkyung…

July 13, 2025

Forgetting Through Transforming: Enabling Federated Unlearning via Class-Aware Representation Transformationby Qi Guo, Zhen Tian, Minghao…

July 13, 2025

TCGU: Data-centric Graph Unlearning based on Transferable Condensationby Fan Li, Xiaoyang Wang, Dawei Cheng, Wenjie…

July 13, 2025

Adaptive Guidance for Local Training in Heterogeneous Federated Learningby Jianqing Zhang, Yang Liu, Yang Hua,…

July 13, 2025

Honesty to Subterfuge: In-Context Reinforcement Learning Can Make Honest Models Reward Hackby Leo McKee-Reid, Christoph…