Quantization – Page 16 – GrooveSquid.com

July 13, 2025

Addressing Representation Collapse in Vector Quantized Models with One Linear Layerby Yongxin Zhu, Bocheng Li,…

July 13, 2025

Conformalized High-Density Quantile Regression via Dynamic Prototypes-based Probability Density Estimationby Batuhan Cengiz, Halil Faruk Karagoz,…

July 13, 2025

Abstracted Shapes as Tokens – A Generalizable and Interpretable Model for Time-series Classificationby Yunshi Wen,…

July 13, 2025

Accelerated AI Inference via Dynamic Execution Methodsby Haim Barad, Jascha Achterberg, Tien Pei Chou, Jean…

July 13, 2025

GWQ: Gradient-Aware Weight Quantization for Large Language Modelsby Yihua Shao, Siyu Liang, Zijian Ling, Minxi…

July 13, 2025

ARQ: A Mixed-Precision Quantization Framework for Accurate and Certifiably Robust DNNsby Yuchen Yang, Shubham Ugare,…

July 13, 2025

BitStack: Any-Size Compression of Large Language Models in Variable Memory Environmentsby Xinghao Wang, Pengyu Wang,…

July 13, 2025

Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Modelby Wenjia Xie,…

July 13, 2025

Data Generation for Hardware-Friendly Post-Training Quantizationby Lior Dikstein, Ariel Lapid, Arnon Netzer, Hai Victor HabiFirst…

July 13, 2025

The Impact of Inference Acceleration on Bias of LLMsby Elisabeth Kirsten, Ivan Habernal, Vedant Nanda,…