Quantization – Page 19 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Quamba: a Post-training Quantization Recipe For Selective State Space Models, by Hung-yueh Chiang et al.

Quamba: A Post-Training Quantization Recipe for Selective State Space Modelsby Hung-Yueh Chiang, Chi-Chih Chang, Natalia…

July 13, 2025

Summary of Asymkv: Enabling 1-bit Quantization Of Kv Cache with Layer-wise Asymmetric Quantization Configurations, by Qian Tao et al.

AsymKV: Enabling 1-Bit Quantization of KV Cache with Layer-Wise Asymmetric Quantization Configurationsby Qian Tao, Wenyuan…

July 13, 2025

Summary of Daq: Density-aware Post-training Weight-only Quantization For Llms, by Yingsong Luo et al.

DAQ: Density-Aware Post-Training Weight-Only Quantization For LLMsby Yingsong Luo, Ling ChenFirst submitted to arxiv on:…

July 13, 2025

Summary of Scaling Laws For Post Training Quantized Large Language Models, by Zifei Xu et al.

Scaling Laws for Post Training Quantized Large Language Modelsby Zifei Xu, Alexander Lan, Wanzin Yazar,…

July 13, 2025

Summary of Efficiera Residual Networks: Hardware-friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical Imagenet Accuracy, by Shuntaro Takahashi and Takuya Wakisaka and Hiroyuki Tokunaga

Efficiera Residual Networks: Hardware-Friendly Fully Binary Weight with 2-bit Activation Model Achieves Practical ImageNet Accuracyby…

July 13, 2025

Summary of Qspec: Speculative Decoding with Complementary Quantization Schemes, by Juntao Zhao et al.

QSpec: Speculative Decoding with Complementary Quantization Schemesby Juntao Zhao, Wenhao Lu, Sheng Wang, Lingpeng Kong,…

July 13, 2025

Summary of Error Diffusion: Post Training Quantization with Block-scaled Number Formats For Neural Networks, by Alireza Khodamoradi et al.

Error Diffusion: Post Training Quantization with Block-Scaled Number Formats for Neural Networksby Alireza Khodamoradi, Kristof…

July 13, 2025

Summary of Continuous Approximations For Improving Quantization Aware Training Of Llms, by He Li et al.

Continuous Approximations for Improving Quantization Aware Training of LLMsby He Li, Jianhang Hong, Yuanzhuo Wu,…

July 13, 2025

Summary of When Attention Sink Emerges in Language Models: An Empirical View, by Xiangming Gu et al.

When Attention Sink Emerges in Language Models: An Empirical Viewby Xiangming Gu, Tianyu Pang, Chao…

July 13, 2025

Summary of Slanc: Static Layernorm Calibration, by Mahsa Salmani et al.

SLaNC: Static LayerNorm Calibrationby Mahsa Salmani, Nikita Trukhanov, Ilya SoloveychikFirst submitted to arxiv on: 14…