Alignment – Page 117 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Lire: Listwise Reward Enhancement For Preference Alignment, by Mingye Zhu et al.

LIRE: listwise reward enhancement for preference alignmentby Mingye Zhu, Yi Liu, Lei Zhang, Junbo Guo,…

July 13, 2025

Summary of Pragmatic Auditing: a Pilot-driven Approach For Auditing Machine Learning Systems, by Djalel Benbouzid et al.

Pragmatic auditing: a pilot-driven approach for auditing Machine Learning systemsby Djalel Benbouzid, Christiane Plociennik, Laura…

July 13, 2025

Summary of Energy Rank Alignment: Using Preference Optimization to Search Chemical Space at Scale, by Shriram Chennakesavalu et al.

Energy Rank Alignment: Using Preference Optimization to Search Chemical Space at Scaleby Shriram Chennakesavalu, Frank…

July 13, 2025

Summary of Exploring and Exploiting the Asymmetric Valley Of Deep Neural Networks, by Xin-chun Li et al.

Exploring and Exploiting the Asymmetric Valley of Deep Neural Networksby Xin-Chun Li, Jin-Lin Tang, Bo…

July 13, 2025

Summary of Spo: Multi-dimensional Preference Sequential Alignment with Implicit Reward Modeling, by Xingzhou Lou et al.

SPO: Multi-Dimensional Preference Sequential Alignment With Implicit Reward Modelingby Xingzhou Lou, Junge Zhang, Jian Xie,…

July 13, 2025

Summary of Hummer: Towards Limited Competitive Preference Dataset, by Li Jiang et al.

Hummer: Towards Limited Competitive Preference Datasetby Li Jiang, Yusen Wu, Junwu Xiong, Jingqing Ruan, Yichuan…

July 13, 2025

Summary of Reproducibility Study Of Cdul: Clip-driven Unsupervised Learning For Multi-label Image Classification, by Manan Shah et al.

Reproducibility Study of CDUL: CLIP-Driven Unsupervised Learning for Multi-Label Image Classificationby Manan Shah, Yash BhalgatFirst…

July 13, 2025

Summary of Openrlhf: An Easy-to-use, Scalable and High-performance Rlhf Framework, by Jian Hu et al.

OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Frameworkby Jian Hu, Xibin Wu, Zilin Zhu, Xianyu,…

July 13, 2025

Summary of Conformal Alignment: Knowing When to Trust Foundation Models with Guarantees, by Yu Gui et al.

Conformal Alignment: Knowing When to Trust Foundation Models with Guaranteesby Yu Gui, Ying Jin, Zhimei…

July 13, 2025

Summary of Spectral Editing Of Activations For Large Language Model Alignment, by Yifu Qiu et al.

Spectral Editing of Activations for Large Language Model Alignmentby Yifu Qiu, Zheng Zhao, Yftah Ziser,…