Quantization – Page 23 – GrooveSquid.com

July 13, 2025

Accumulator-Aware Post-Training Quantizationby Ian Colbert, Fabian Grob, Giuseppe Franco, Jinjie Zhang, Rayan SaabFirst submitted to…

July 13, 2025

AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantizationby Yifan Tan, Haoze Wang, Chao Yan,…

July 13, 2025

A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithmsby Ruihao Gong, Yifu Ding,…

July 13, 2025

Communication and Energy Efficient Federated Learning using Zero-Order Optimization Techniqueby Elissa Mhanna, Mohamad AssaadFirst submitted…

July 13, 2025

Disentanglement with Factor Quantized Variational Autoencodersby Gulcin Baykal, Melih Kandemir, Gozde UnalFirst submitted to arxiv…

July 13, 2025

CorBin-FL: A Differentially Private Federated Learning Mechanism using Common Randomnessby Hojat Allah Salehi, Md Jueal…

July 13, 2025

Bilateral Sharpness-Aware Minimization for Flatter Minimaby Jiaxin Deng, Junbiao Pang, Baochang Zhang, Qingming HuangFirst submitted…

July 13, 2025

Scaling FP8 training to trillion-token LLMsby Maxim Fishman, Brian Chmiel, Ron Banner, Daniel SoudryFirst submitted…

July 13, 2025

Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD)by Tashfain Ahmed,…

July 13, 2025

Art and Science of Quantizing Large-Scale Models: A Comprehensive Overviewby Yanshu Wang, Tong Yang, Xiyan…