Quantization – Page 31 – GrooveSquid.com

July 13, 2025

The Impact of Quantization and Pruning on Deep Reinforcement Learning Modelsby Heng Lu, Mehdi Alemi,…

July 13, 2025

QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clusteringby…

July 13, 2025

How Does Quantization Affect Multilingual LLMs?by Kelly Marchisio, Saurabh Dash, Hongyu Chen, Dennis Aumiller, Ahmet…

July 13, 2025

GPTQT: Quantize Large Language Models Twice to Push the Efficiencyby Yipin Guo, Yilin Lang, Qinyuan…

July 13, 2025

SFC: Achieve Accurate Fast Convolution under Low-precision Arithmeticby Liulu He, Yufei Zhao, Rui Gao, Yuan…

July 13, 2025

QSync: Quantization-Minimized Synchronous Distributed Training Across Hybrid Devicesby Juntao Zhao, Borui Wan, Yanghua Peng, Haibin…

July 13, 2025

Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networksby Beatrice Alessandra Motetti, Matteo…

July 13, 2025

LLMEasyQuant – An Easy to Use Toolkit for LLM Quantizationby Dong Liu, Kaiser PisterFirst submitted…

July 13, 2025

Reliable edge machine learning hardware for scientific applicationsby Tommaso Baldi, Javier Campos, Ben Hawks, Jennifer…

July 13, 2025

FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantizationby Linping Qu, Shenghui…