Alignment – Page 73 – GrooveSquid.com

July 13, 2025

B-cosification: Transforming Deep Neural Networks to be Inherently Interpretableby Shreyash Arya, Sukrut Rao, Moritz Böhle,…

July 13, 2025

Active Preference-based Learning for Multi-dimensional Personalizationby Minhyeon Oh, Seungjoon Lee, Jungseul OkFirst submitted to arxiv…

July 13, 2025

Adapting Language Models via Token Translationby Zhili Feng, Tanya Marwah, Nicolo Fusi, David Alvarez-Melis, Lester…

July 13, 2025

ResiDual Transformer Alignment with Spectral Decompositionby Lorenzo Basile, Valentino Maiorca, Luca Bortolussi, Emanuele Rodolà, Francesco…

July 13, 2025

Enhancing Diversity in Bayesian Deep Learning via Hyperspherical Energy Minimization of CKAby David Smerkous, Qinxun…

July 13, 2025

SelfCodeAlign: Self-Alignment for Code Generationby Yuxiang Wei, Federico Cassano, Jiawei Liu, Yifeng Ding, Naman Jain,…

July 13, 2025

Dynamical similarity analysis can identify compositional dynamics developing in RNNsby Quentin Guilhot, Michał Wójcik, Jascha…

July 13, 2025

Representative Social Choice: From Learning Theory to AI Alignmentby Tianyi QiuFirst submitted to arxiv on:…

July 13, 2025

Adaptive Alignment: Dynamic Preference Adjustments via Multi-Objective Reinforcement Learning for Pluralistic AIby Hadassah Harland, Richard…

July 13, 2025

Rethinking Inverse Reinforcement Learning: from Data Alignment to Task Alignmentby Weichao Zhou, Wenchao LiFirst submitted…