Alignment – Page 75 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Robot Policy Learning with Temporal Optimal Transport Reward, by Yuwei Fu et al.

Robot Policy Learning with Temporal Optimal Transport Rewardby Yuwei Fu, Haichao Zhang, Di Wu, Wei…

July 13, 2025

Summary of Dimensionality-induced Information Loss Of Outliers in Deep Neural Networks, by Kazuki Uematsu et al.

Dimensionality-induced information loss of outliers in deep neural networksby Kazuki Uematsu, Kosuke Haruki, Taiji Suzuki,…

July 13, 2025

Summary of Towards Multi-dimensional Explanation Alignment For Medical Classification, by Lijie Hu et al.

Towards Multi-dimensional Explanation Alignment for Medical Classificationby Lijie Hu, Songning Lai, Wenshuo Chen, Hongru Xiao,…

July 13, 2025

Summary of L3ms — Lagrange Large Language Models, by Guneet S. Dhillon et al.

L3Ms – Lagrange Large Language Modelsby Guneet S. Dhillon, Xingjian Shi, Yee Whye Teh, Alex…

July 13, 2025

Summary of Uft: Unifying Fine-tuning Of Sft and Rlhf/dpo/una Through a Generalized Implicit Reward Function, by Zhichao Wang et al.

UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Functionby Zhichao Wang,…

July 13, 2025

Summary of Flaming-hot Initiation with Regular Execution Sampling For Large Language Models, by Weizhe Chen et al.

Flaming-hot Initiation with Regular Execution Sampling for Large Language Modelsby Weizhe Chen, Zhicheng Zhang, Guanlin…

July 13, 2025

Summary of Diff-instruct*: Towards Human-preferred One-step Text-to-image Generative Models, by Weijian Luo and Colin Zhang and Debing Zhang and Zhengyang Geng

Diff-Instruct*: Towards Human-Preferred One-step Text-to-image Generative Modelsby Weijian Luo, Colin Zhang, Debing Zhang, Zhengyang GengFirst…

July 13, 2025

Summary of Physics-informed Partitioned Coupled Neural Operator For Complex Networks, by Weidong Wu et al.

Physics-informed Partitioned Coupled Neural Operator for Complex Networksby Weidong Wu, Yong Zhang, Lili Hao, Yang…

July 13, 2025

Summary of Shopping Mmlu: a Massive Multi-task Online Shopping Benchmark For Large Language Models, by Yilun Jin et al.

Shopping MMLU: A Massive Multi-Task Online Shopping Benchmark for Large Language Modelsby Yilun Jin, Zheng…