Fine tuning – Page 136 – GrooveSquid.com

July 13, 2025

Discrete Copula Diffusionby Anji Liu, Oliver Broadrick, Mathias Niepert, Guy Van den BroeckFirst submitted to…

July 13, 2025

House of Cards: Massive Weights in LLMsby Jaehoon Oh, Seungjun Shin, Dokwan OhFirst submitted to…

July 13, 2025

NEAT: Nonlinear Parameter-efficient Adaptation of Pre-trained Modelsby Yibo Zhong, Haoxiang Jiang, Lincan Li, Ryumei Nakada,…

July 13, 2025

Not All LLM Reasoners Are Created Equalby Arian Hosseini, Alessandro Sordoni, Daniel Toyama, Aaron Courville,…

July 13, 2025

DLP-LoRA: Efficient Task-Specific LoRA Fusion with a Dynamic, Lightweight Plugin for Large Language Modelsby Yuxuan…

July 13, 2025

Speculative Coreset Selection for Task-Specific Fine-tuningby Xiaoyu Zhang, Juan Zhai, Shiqing Ma, Chao Shen, Tianlin…

July 13, 2025

Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Modelsby Lucas Bandarkar, Benjamin Muller, Pritish…

July 13, 2025

FlashMask: Efficient and Rich Mask Extension of FlashAttentionby Guoxia Wang, Jinle Zeng, Xiyuan Xiao, Siming…

July 13, 2025

A Knowledge-Informed Large Language Model Framework for U.S. Nuclear Power Plant Shutdown Initiating Event Classification…

July 13, 2025

MoS: Unleashing Parameter Efficiency of Low-Rank Adaptation with Mixture of Shardsby Sheng Wang, Liheng Chen,…