Quantization – Page 21 – GrooveSquid.com

July 13, 2025

Restructuring Vector Quantization with the Rotation Trickby Christopher Fifty, Ronald G. Junkins, Dennis Duan, Aniketh…

July 13, 2025

Mixture Compressor for Mixture-of-Experts LLMs Gains Moreby Wei Huang, Yue Liao, Jianhui Liu, Ruifei He,…

July 13, 2025

QT-DoG: Quantization-aware Training for Domain Generalizationby Saqib Javed, Hieu Le, Mathieu SalzmannFirst submitted to arxiv…

July 13, 2025

QERA: an Analytical Framework for Quantization Error Reconstructionby Cheng Zhang, Jeffrey T. H. Wong, Can…

July 13, 2025

Accelerating Error Correction Code Transformersby Matan Levy, Yoni Choukroun, Lior WolfFirst submitted to arxiv on:…

July 13, 2025

PalmBench: A Comprehensive Benchmark of Compressed Large Language Models on Mobile Platformsby Yilong Li, Jingyu…

July 13, 2025

PrefixQuant: Eliminating Outliers by Prefixed Tokens for Large Language Models Quantizationby Mengzhao Chen, Yi Liu,…

July 13, 2025

Resource-aware Mixed-precision Quantization for Enhancing Deployability of Transformers for Time-series Forecasting on Embedded FPGAsby Tianheng…

July 13, 2025

Mitigating Adversarial Perturbations for Deep Reinforcement Learning via Vector Quantizationby Tung M. Luu, Thanh Nguyen,…

July 13, 2025

ARB-LLM: Alternating Refined Binarizations for Large Language Modelsby Zhiteng Li, Xianglong Yan, Tianao Zhang, Haotong…