Alignment – Page 132 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Reformatted Alignment, by Run-ze Fan et al.

Reformatted Alignmentby Run-Ze Fan, Xuefeng Li, Haoyang Zou, Junlong Li, Shwai He, Ethan Chern, Jiewen…

July 13, 2025

Summary of Anygpt: Unified Multimodal Llm with Discrete Sequence Modeling, by Jun Zhan et al.

AnyGPT: Unified Multimodal LLM with Discrete Sequence Modelingby Jun Zhan, Junqi Dai, Jiasheng Ye, Yunhua…

July 13, 2025

Summary of Revisiting Zeroth-order Optimization For Memory-efficient Llm Fine-tuning: a Benchmark, by Yihua Zhang et al.

Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmarkby Yihua Zhang, Pingzhi Li, Junyuan Hong,…

July 13, 2025

Summary of Aligning Modalities in Vision Large Language Models Via Preference Fine-tuning, by Yiyang Zhou et al.

Aligning Modalities in Vision Large Language Models via Preference Fine-tuningby Yiyang Zhou, Chenhang Cui, Rafael…

July 13, 2025

Summary of Aligning Large Language Models by On-policy Self-judgment, By Sangkyu Lee et al.

Aligning Large Language Models by On-Policy Self-Judgmentby Sangkyu Lee, Sungdong Kim, Ashkan Yousefpour, Minjoon Seo,…

July 13, 2025

Summary of Multi-modal Preference Alignment Remedies Degradation Of Visual Instruction Tuning on Language Models, by Shengzhi Li et al.

Multi-modal Preference Alignment Remedies Degradation of Visual Instruction Tuning on Language Modelsby Shengzhi Li, Rongyu…

July 13, 2025

Summary of Active Preference Optimization For Sample Efficient Rlhf, by Nirjhar Das et al.

Active Preference Optimization for Sample Efficient RLHFby Nirjhar Das, Souradip Chakraborty, Aldo Pacchiano, Sayak Ray…

July 13, 2025

Summary of Efficient Generative Modeling Via Penalized Optimal Transport Network, by Wenhui Sophia Lu et al.

Efficient Generative Modeling via Penalized Optimal Transport Networkby Wenhui Sophia Lu, Chenyang Zhong, Wing Hung…

July 13, 2025

Summary of Pretext Training Algorithms For Event Sequence Data, by Yimu Wang et al.

Pretext Training Algorithms for Event Sequence Databy Yimu Wang, He Zhao, Ruizhi Deng, Frederick Tung,…

July 13, 2025

Summary of Rewards-in-context: Multi-objective Alignment Of Foundation Models with Dynamic Preference Adjustment, by Rui Yang et al.

Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustmentby Rui Yang, Xiaoman Pan, Feng…