Quantization – Page 10 – GrooveSquid.com

July 13, 2025

ResQ: Mixed-Precision Quantization of Large Language Models with Low-Rank Residualsby Utkarsh Saxena, Sayeh Sharify, Kaushik…

July 13, 2025

VidTok: A Versatile and Open-Source Video Tokenizerby Anni Tang, Tianyu He, Junliang Guo, Xinle Cheng,…

July 13, 2025

Apollo-Forecast: Overcoming Aliasing and Inference Speed Challenges in Language Models for Time Series Forecastingby Tianyi…

July 13, 2025

Fast and Slow Gradient Approximation for Binary Neural Network Optimizationby Xinquan Chen, Junqi Gao, Biqing…

July 13, 2025

QPruner: Probabilistic Decision Quantization for Structured Pruning in Large Language Modelsby Changhai Zhou, Yuhua Zhou,…

July 13, 2025

FinLoRA: Finetuning Quantized Financial Large Language Models Using Low-Rank Adaptationby Dannong Wang, Daniel Kim, Bo…

July 13, 2025

Progressive Compression with Universally Quantized Diffusion Modelsby Yibo Yang, Justus C. Will, Stephan MandtFirst submitted…

July 13, 2025

Adaptive Quantization Resolution and Power Control for Federated Learning over Cell-free Networksby Afsaneh Mahmoudi, Emil…

July 13, 2025

Memory-Efficient 4-bit Preconditioned Stochastic Optimizationby Jingyang Li, Kuangyu Ding, Kim-Chuan Toh, Pan ZhouFirst submitted to…

July 13, 2025

Efficient Generative Modeling with Residual Vector Quantization-Based Tokensby Jaehyeon Kim, Taehong Moon, Keon Lee, Jaewoong…