Fine tuning – Page 116 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Coat: Compressing Optimizer States and Activation For Memory-efficient Fp8 Training, by Haocheng Xi et al.

COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Trainingby Haocheng Xi, Han Cai, Ligeng…

July 13, 2025

Summary of Inference Time Llm Alignment in Single and Multidomain Preference Spectrum, by Sadat Shahriar et al.

Inference time LLM alignment in single and multidomain preference spectrumby Sadat Shahriar, Zheng Qi, Nikolaos…

July 13, 2025

Summary of On the Crucial Role Of Initialization For Matrix Factorization, by Bingcong Li et al.

On the Crucial Role of Initialization for Matrix Factorizationby Bingcong Li, Liang Zhang, Aryan Mokhtari,…

July 13, 2025

Summary of From Imitation to Introspection: Probing Self-consciousness in Language Models, by Sirui Chen et al.

From Imitation to Introspection: Probing Self-Consciousness in Language Modelsby Sirui Chen, Shu Yu, Shengjie Zhao,…

July 13, 2025

Summary of Aligning Codellms with Direct Preference Optimization, by Yibo Miao et al.

Aligning CodeLLMs with Direct Preference Optimizationby Yibo Miao, Bofei Gao, Shanghaoran Quan, Junyang Lin, Daoguang…

July 13, 2025

Summary of Samg: Offline-to-online Reinforcement Learning Via State-action-conditional Offline Model Guidance, by Liyu Zhang et al.

SAMG: Offline-to-Online Reinforcement Learning via State-Action-Conditional Offline Model Guidanceby Liyu Zhang, Haochi Wu, Xu Wan,…

July 13, 2025

Summary of 3d Shape Completion with Test-time Training, by Michael Schopf-kuester et al.

3D Shape Completion with Test-Time Trainingby Michael Schopf-Kuester, Zorah Lähner, Michael MoellerFirst submitted to arxiv…

July 13, 2025

Summary of Towards Understanding the Fragility Of Multilingual Llms Against Fine-tuning Attacks, by Samuele Poppi et al.

Towards Understanding the Fragility of Multilingual LLMs against Fine-Tuning Attacksby Samuele Poppi, Zheng-Xin Yong, Yifei…

July 13, 2025

Summary of Lego: Language Model Building Blocks, by Shrenik Bhansali et al.

LEGO: Language Model Building Blocksby Shrenik Bhansali, Alwin Jin, Tyler Lizzo, Larry HeckFirst submitted to…

July 13, 2025

Summary of Aggregated Knowledge Model: Enhancing Domain-specific Qa with Fine-tuned and Retrieval-augmented Generation Models, by Fengchen Liu et al.

Aggregated Knowledge Model: Enhancing Domain-Specific QA with Fine-Tuned and Retrieval-Augmented Generation Modelsby Fengchen Liu, Jordan…