Inference – Page 70 – GrooveSquid.com

July 13, 2025

Pushing the Envelope of Low-Bit LLM via Dynamic Error Compensationby Yeonhong Park, Jake Hyun, Hojoon…

July 13, 2025

Sequence Generation Modeling for Continuous Value Predictionby Hongxu Ma, Kai Tian, Tao Zhang, Xuefeng Zhang,…

July 13, 2025

Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scalesby Shuokai Pan, Gerti Tuzi, Sudarshan Sreeram,…

July 13, 2025

Goal-oriented Communications based on Recursive Early Exit Neural Networksby Jary Pomponi, Mattia Merluzzi, Alessio Devoto,…

July 13, 2025

InfAlign: Inference-aware language model alignmentby Ananth Balashankar, Ziteng Sun, Jonathan Berant, Jacob Eisenstein, Michael Collins,…

July 13, 2025

Revisiting PCA for time series reduction in temporal dimensionby Jiaxin Gao, Wenbo Hu, Yuntian ChenFirst…

July 13, 2025

Latenrgy: Model Agnostic Latency and Energy Consumption Prediction for Binary Classifiersby Jason M. PittmanFirst submitted…

July 13, 2025

Adaptive Conformal Inference by Bettingby Aleksandr Podkopaev, Darren Xu, Kuang-Chih LeeFirst submitted to arxiv on:…

July 13, 2025

Performance Control in Early Exiting to Deploy Large Models at the Same Cost of Smaller…

July 13, 2025

Evaluating deep learning models for fault diagnosis of a rotating machinery with epistemic and aleatoric…