Alignment – Page 90 – GrooveSquid.com

July 13, 2025

Summary of Semi-supervised Reward Modeling Via Iterative Self-training, by Yifei He et al.

Semi-Supervised Reward Modeling via Iterative Self-Trainingby Yifei He, Haoxiang Wang, Ziyan Jiang, Alexandros Papangelis, Han…

July 13, 2025

Summary of Geometric-averaged Preference Optimization For Soft Preference Labels, by Hiroki Furuta et al.

Geometric-Averaged Preference Optimization for Soft Preference Labelsby Hiroki Furuta, Kuang-Huei Lee, Shixiang Shane Gu, Yutaka…

July 13, 2025

Summary of Connecting Concept Convexity and Human-machine Alignment in Deep Neural Networks, by Teresa Dorszewski et al.

Connecting Concept Convexity and Human-Machine Alignment in Deep Neural Networksby Teresa Dorszewski, Lenka Tětková, Lorenz…

July 13, 2025

Summary of Alt-moe:a Scalable Framework For Bidirectional Multimodal Alignment and Efficient Knowledge Integration, by Hongyang Lei et al.

Alt-MoE:A Scalable Framework for Bidirectional Multimodal Alignment and Efficient Knowledge Integrationby Hongyang Lei, Xiaolong Cheng,…

July 13, 2025

Summary of Forward Kl Regularized Preference Optimization For Aligning Diffusion Policies, by Zhao Shan et al.

Forward KL Regularized Preference Optimization for Aligning Diffusion Policiesby Zhao Shan, Chenyou Fan, Shuang Qiu,…

July 13, 2025

Summary of Evaluating Open-source Sparse Autoencoders on Disentangling Factual Knowledge in Gpt-2 Small, by Maheep Chaudhary and Atticus Geiger

Evaluating Open-Source Sparse Autoencoders on Disentangling Factual Knowledge in GPT-2 Smallby Maheep Chaudhary, Atticus GeigerFirst…

July 13, 2025

Summary of Tso: Self-training with Scaled Preference Optimization, by Kaihui Chen et al.

TSO: Self-Training with Scaled Preference Optimizationby Kaihui Chen, Hao Yi, Qingyang Li, Tianyu Qi, Yulan…

July 13, 2025

Summary of Optimizing Clip Models For Image Retrieval with Maintained Joint-embedding Alignment, by Konstantin Schall et al.

Optimizing CLIP Models for Image Retrieval with Maintained Joint-Embedding Alignmentby Konstantin Schall, Kai Uwe Barthel,…

July 13, 2025

Summary of Sync From the Sea: Retrieving Alignable Videos From Large-scale Datasets, by Ishan Rajendrakumar Dave et al.

Sync from the Sea: Retrieving Alignable Videos from Large-Scale Datasetsby Ishan Rajendrakumar Dave, Fabian Caba…

July 13, 2025

Summary of Finepseudo: Improving Pseudo-labelling Through Temporal-alignablity For Semi-supervised Fine-grained Action Recognition, by Ishan Rajendrakumar Dave et al.

FinePseudo: Improving Pseudo-Labelling through Temporal-Alignablity for Semi-Supervised Fine-Grained Action Recognitionby Ishan Rajendrakumar Dave, Mamshad Nayeem…