Quantization – Page 12 – GrooveSquid.com

July 13, 2025

SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantizationby Runsheng Bai, Bo Liu, Qiang LiuFirst…

July 13, 2025

Quantized and Interpretable Learning Scheme for Deep Neural Networks in Classification Taskby Alireza Maleki, Mahsa…

July 13, 2025

CPTQuant - A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Modelsby Amitash Nanda,…

July 13, 2025

FlashAttention on a Napkin: A Diagrammatic Approach to Deep Learning IO-Awarenessby Vincent Abbott, Gioele ZardiniFirst…

July 13, 2025

Unifying KV Cache Compression for Large Language Models with LeanKVby Yanqi Zhang, Yuwei Hu, Runyuan…

July 13, 2025

CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMsby Abhas Kumar,…

July 13, 2025

RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracyby Geonho Lee,…

July 13, 2025

A Wave is Worth 100 Words: Investigating Cross-Domain Transferability in Time Seriesby Xiangkai Ma, Xiaobin…

July 13, 2025

DFRot: Achieving Outlier-Free and Massive Activation-Free for Rotated LLMs with Refined Rotationby Jingyang Xiang, Sai…

July 13, 2025

Training Multi-Layer Binary Neural Networks With Local Binary Error Signalsby Luca Colombo, Fabrizio Pittorino, Manuel…