Pruning – Page 29 – GrooveSquid.com

July 13, 2025

Mamba-PTQ: Outlier Channels in Recurrent Large Language Modelsby Alessandro Pierro, Steven AbreuFirst submitted to arxiv…

July 13, 2025

Team up GBDTs and DNNs: Advancing Efficient and Effective Tabular Prediction with Tree-hybrid MLPsby Jiahuan…

July 13, 2025

Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Expertsby Zeliang Zhang, Xiaodong Liu, Hao…

July 13, 2025

Weight Block Sparsity: Training, Compilation, and AI Engine Acceleratorsby Paolo D'Alberto, Taehee Jeong, Akshai Jain,…

July 13, 2025

Automatic Pruning of Fine-tuning Datasets for Transformer-based Language Modelsby Mohammadreza Tayaranian, Seyyed Hasan Mozafari, Brett…

July 13, 2025

Characterizing Prompt Compression Methods for Long Context Inferenceby Siddharth Jha, Lutfi Eren Erdogan, Sehoon Kim,…

July 13, 2025

Explaining Graph Neural Networks for Node Similarity on Graphsby Daniel Daza, Cuong Xuan Chu, Trung-Kien…

July 13, 2025

Graph Anomaly Detection with Noisy Labels by Reinforcement Learningby Zhu Wang, Shuang Zhou, Junnan Dong,…

July 13, 2025

Pruning One More Token is Enough: Leveraging Latency-Workload Non-Linearities for Vision Transformers on the Edgeby…

July 13, 2025

DMTG: One-Shot Differentiable Multi-Task Groupingby Yuan Gao, Shuguo Jiang, Moran Li, Jin-Gang Yu, Gui-Song XiaFirst…