Fine tuning – Page 188 – GrooveSquid.com

July 13, 2025

Summary of Large Language Models Can Self-improve at Web Agent Tasks, by Ajay Patel et al.

Large Language Models Can Self-Improve At Web Agent Tasksby Ajay Patel, Markus Hofmarcher, Claudiu Leoveanu-Condrei,…

July 13, 2025

Summary of Exploring Diffusion Models’ Corruption Stage in Few-shot Fine-tuning and Mitigating with Bayesian Neural Networks, by Xiaoyu Wu et al.

Exploring Diffusion Models’ Corruption Stage in Few-Shot Fine-tuning and Mitigating with Bayesian Neural Networksby Xiaoyu…

July 13, 2025

Summary of Mm-lego: Modular Biomedical Multimodal Models with Minimal Fine-tuning, by Konstantin Hemker et al.

MM-Lego: Modular Biomedical Multimodal Models with Minimal Fine-Tuningby Konstantin Hemker, Nikola Simidjievski, Mateja JamnikFirst submitted…

July 13, 2025

Summary of Would I Lie to You? Inference Time Alignment Of Language Models Using Direct Preference Heads, by Avelina Asada Hadji-kyriacou and Ognjen Arandjelovic

Would I Lie To You? Inference Time Alignment of Language Models using Direct Preference Headsby…

July 13, 2025

Summary of Preference Alignment with Flow Matching, by Minu Kim et al.

Preference Alignment with Flow Matchingby Minu Kim, Yongsik Lee, Sehyeok Kang, Jihwan Oh, Song Chong,…

July 13, 2025

Summary of Is In-context Learning Sufficient For Instruction Following in Llms?, by Hao Zhao et al.

Is In-Context Learning Sufficient for Instruction Following in LLMs?by Hao Zhao, Maksym Andriushchenko, Francesco Croce,…

July 13, 2025

Summary of Bridging Model-based Optimization and Generative Modeling Via Conservative Fine-tuning Of Diffusion Models, by Masatoshi Uehara et al.

Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Modelsby Masatoshi Uehara, Yulai…

July 13, 2025

Summary of Stress-testing Capability Elicitation with Password-locked Models, by Ryan Greenblatt et al.

Stress-Testing Capability Elicitation With Password-Locked Modelsby Ryan Greenblatt, Fabien Roger, Dmitrii Krasheninnikov, David KruegerFirst submitted…

July 13, 2025

Summary of Sam-e: Leveraging Visual Foundation Model with Sequence Imitation For Embodied Manipulation, by Junjie Zhang et al.

SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulationby Junjie Zhang, Chenjia Bai,…

July 13, 2025

Summary of Svft: Parameter-efficient Fine-tuning with Singular Vectors, by Vijay Lingam et al.

SVFT: Parameter-Efficient Fine-Tuning with Singular Vectorsby Vijay Lingam, Atula Tejaswi, Aditya Vavre, Aneesh Shetty, Gautham…