Model compression – Page 6

July 13, 2025

From Algorithm to Hardware: A Survey on Efficient and Safe Deployment of Deep Neural Networksby…

July 13, 2025

FedGreen: Carbon-aware Federated Learning with Model Size Adaptationby Ali Abbasi, Fan Dong, Xin Wang, Henry…

July 13, 2025

Bayesian Federated Model Compression for Communication and Computation Efficiencyby Chengyu Xia, Danny H. K. Tsang,…

July 13, 2025

Enhancing Inference Efficiency of Large Language Models: Investigating Optimization Strategies and Architectural Innovationsby Georgy TyukinFirst…

July 13, 2025

Improve Knowledge Distillation via Label Revision and Data Selectionby Weichao Lan, Yiu-ming Cheung, Qing Xu,…

July 13, 2025

Instance-Aware Group Quantization for Vision Transformersby Jaehyeon Moon, Dohyung Kim, Junyong Cheon, Bumsub HamFirst submitted…

July 13, 2025

Are Compressed Language Models Less Subgroup Robust?by Leonidas Gee, Andrea Zugarini, Novi QuadriantoFirst submitted to…

July 13, 2025

Advancing IIoT with Over-the-Air Federated Learning: The Role of Iterative Magnitude Pruningby Fazal Muhammad Ali…

July 13, 2025

DiPaCo: Distributed Path Compositionby Arthur Douillard, Qixuan Feng, Andrei A. Rusu, Adhiguna Kuncoro, Yani Donchev,…

July 13, 2025

Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiencyby Hallgrimur Thorsteinsson,…