Quantization – Page 11 – GrooveSquid.com

July 13, 2025

TTAQ: Towards Stable Post-training Quantization in Continuous Domain Adaptationby Junrui Xiao, Zhikai Li, Lianwei Yang,…

July 13, 2025

DQA: An Efficient Method for Deep Quantization of Deep Neural Network Activationsby Wenhao Hu, Paul…

July 13, 2025

CRVQ: Channel-Relaxed Vector Quantization for Extreme Compression of LLMsby Yuzhuang Xu, Shiyu Ji, Qingfu Zhu,…

July 13, 2025

Optimising TinyML with Quantization and Distillation of Transformer and Mamba Models for Indoor Localisation on…

July 13, 2025

Lexico: Extreme KV Cache Compression via Sparse Coding over Universal Dictionariesby Junhyuck Kim, Jongho Park,…

July 13, 2025

TurboAttention: Efficient Attention Approximation For High Throughputs LLMsby Hao Kang, Srikant Bharadwaj, James Hensman, Tushar…

July 13, 2025

Low-Rank Correction for Quantized LLMsby Meyer Scetbon, James HensmanFirst submitted to arxiv on: 10 Dec…

July 13, 2025

Post-Training Non-Uniform Quantization for Convolutional Neural Networksby Ahmed Luqman, Khuzemah Qazi, Imdadullah KhanFirst submitted to…

July 13, 2025

Taming Sensitive Weights : Noise Perturbation Fine-tuning for Robust LLM Quantizationby Dongwei Wang, Huanrui YangFirst…

July 13, 2025

FP=xINT:A Low-Bit Series Expansion Algorithm for Post-Training Quantizationby Boyang Zhang, Daning Cheng, Yunquan Zhang, Fangmin…