Quantization – Page 35 – GrooveSquid.com

July 13, 2025

Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsityby Wentao Guo, Jikai Long, Yimeng Zeng, Zirui Liu,…

July 13, 2025

SLTrain: a sparse plus low-rank approach for parameter and memory efficient pretrainingby Andi Han, Jiaxiang…

July 13, 2025

MagR: Weight Magnitude Reduction for Enhancing Post-Training Quantizationby Aozhong Zhang, Naigang Wang, Yanxia Deng, Xin…

July 13, 2025

Outliers and Calibration Sets have Diminishing Effect on Quantization of Modern LLMsby Davide Paglieri, Saurabh…

July 13, 2025

Effective Interplay between Sparsity and Quantization: From Theory to Practiceby Simla Burcu Harma, Ayan Chakraborty,…

July 13, 2025

LCQ: Low-Rank Codebook based Quantization for Large Language Modelsby Wen-Pu Cai, Ming-Yang Li, Wu-Jun LiFirst…

July 13, 2025

Understanding and Minimising Outlier Features in Neural Network Trainingby Bobby He, Lorenzo Noci, Daniele Paliotta,…

July 13, 2025

Exploiting LLM Quantizationby Kazuki Egashira, Mark Vero, Robin Staab, Jingxuan He, Martin VechevFirst submitted to…

July 13, 2025

4-bit Shampoo for Memory-Efficient Network Trainingby Sike Wang, Pan Zhou, Jia Li, Hua HuangFirst submitted…

July 13, 2025

I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Modelsby Xing Hu, Yuan Cheng, Dawei…