Alignment – Page 131 – GrooveSquid.com

July 13, 2025

Unintended Impacts of LLM Alignment on Global Representationby Michael J. Ryan, William Held, Diyi YangFirst…

July 13, 2025

Don’t Just Say “I don’t know”! Self-aligning Large Language Models for Responding to Unknown Questions…

July 13, 2025

COMPASS: Computational Mapping of Patient-Therapist Alliance Strategies with Language Modelingby Baihan Lin, Djallel Bouneffouf, Yulia…

July 13, 2025

Back to Basics: Revisiting REINFORCE Style Optimization for Learning from Human Feedback in LLMsby Arash…

July 13, 2025

T-Stitch: Accelerating Sampling in Pre-Trained Diffusion Models with Trajectory Stitchingby Zizheng Pan, Bohan Zhuang, De-An…

July 13, 2025

Inductive Graph Alignment Prompt: Bridging the Gap between Graph Pre-training and Inductive Fine-tuning From Spectral…

July 13, 2025

Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positiveby Arka Pal, Deep Karkhanis, Samuel Dooley,…

July 13, 2025

Modality-Aware Integration with Large Language Models for Knowledge-based Visual Question Answeringby Junnan Dong, Qinggang Zhang,…

July 13, 2025

Emulated Disalignment: Safety Alignment for Large Language Models May Backfire!by Zhanhui Zhou, Jie Liu, Zhichen…

July 13, 2025

Adversarial Feature Alignment: Balancing Robustness and Accuracy in Deep Learning via Adversarial Trainingby Leo Hyun…