Quantization – Page 9 – GrooveSquid.com

July 13, 2025

IMSSA: Deploying modern state-space models on memristive in-memory compute hardwareby Sebastian Siegel, Ming-Jay Yang, John-Paul…

July 13, 2025

Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scalesby Shuokai Pan, Gerti Tuzi, Sudarshan Sreeram,…

July 13, 2025

Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computingby Inpyo Hong, Youngwan…

July 13, 2025

Semantic Residual for Multimodal Unified Discrete Representationby Hai Huang, Shulei Wang, Yan XiaFirst submitted to…

July 13, 2025

Recommending Pre-Trained Models for IoT Devicesby Parth V. Patil, Wenxin Jiang, Huiyun Peng, Daniel Lugo,…

July 13, 2025

Unified Stochastic Framework for Neural Network Quantization and Pruningby Haoyu Zhang, Rayan SaabFirst submitted to…

July 13, 2025

GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inferenceby Chao Zeng, Songwei Liu,…

July 13, 2025

Improving Quantization-aware Training of Low-Precision Network via Block Replacement on Full-Precision Counterpartby Chengting Yu, Shu…

July 13, 2025

Preventing Local Pitfalls in Vector Quantization via Optimal Transportby Borui Zhang, Wenzhao Zheng, Jie Zhou,…

July 13, 2025

MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Designby Zhen Zheng, Xiaonan…