Quantization – Page 48 – GrooveSquid.com

July 13, 2025

LQER: Low-Rank Quantization Error Reconstruction for LLMsby Cheng Zhang, Jianyi Cheng, George A. Constantinides, Yiren…

July 13, 2025

Locally-Adaptive Quantization for Streaming Vector Searchby Cecilia Aguerrebere, Mark Hildebrand, Ishwar Singh Bhati, Theodore Willke,…

July 13, 2025

Improved Quantization Strategies for Managing Heavy-tailed Gradients in Distributed Learningby Guangfeng Yan, Tan Li, Yuanzhang…

July 13, 2025

Large Language Models for Time Series: A Surveyby Xiyuan Zhang, Ranak Roy Chowdhury, Rajesh K.…

July 13, 2025

SignSGD with Federated Defense: Harnessing Adversarial Attacks through Gradient Sign Decodingby Chanho Park, Namyoon LeeFirst…

July 13, 2025

Truncated Non-Uniform Quantization for Distributed SGDby Guangfeng Yan, Tan Li, Yuanzhang Xiao, Congduan Li, Linqi…

July 13, 2025

HW-SW Optimization of DNNs for Privacy-preserving People Counting on Low-resolution Infrared Arraysby Matteo Risso, Chen…

July 13, 2025

FedShift: Robust Federated Learning Aggregation Scheme in Resource Constrained Environment via Weight Shiftingby Jungwon Seo,…

July 13, 2025

KVQuant: Towards 10 Million Context Length LLM Inference with KV Cache Quantizationby Coleman Hooper, Sehoon…

July 13, 2025

Trainable Fixed-Point Quantization for Deep Learning Acceleration on FPGAsby Dingyi Dai, Yichi Zhang, Jiahao Zhang,…