Model compression – GrooveSquid.com

July 13, 2025

Optimization and Scalability of Collaborative Filtering Algorithms in Large Language Modelsby Haowei Yang, Longfei Yun,…

July 13, 2025

Compression for Better: A General and Stable Lossless Compression Frameworkby Boyang Zhang, Daning Cheng, Yunquan…

July 13, 2025

LLMCBench: Benchmarking Large Language Model Compression for Efficient Deploymentby Ge Yang, Changyi He, Jinyang Guo,…

July 13, 2025

EoRA: Training-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximationby Shih-Yang Liu, Maksim Khadkevich, Nai…

July 13, 2025

Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approachesby Yanjie Dong, Haijun Zhang,…

July 13, 2025

Q-DiT: Accurate Post-Training Quantization for Diffusion Transformersby Lei Chen, Yuan Meng, Chen Tang, Xinzhu Ma,…

July 13, 2025

Pruning via Merging: Compressing LLMs via Manifold Alignment Based Layer Mergingby Deyuan Liu, Zhanyue Qin,…

July 13, 2025

Trio-ViT: Post-Training Quantization and Acceleration for Softmax-Free Efficient Vision Transformerby Huihong Shi, Haikuo Shao, Wendong…

July 13, 2025

On Linearizing Structured Data in Encoder-Decoder Language Models: Insights from Text-to-SQLby Yutong Shao, Ndapa NakasholeFirst…

July 13, 2025

Streamlining Redundant Layers to Compress Large Language Modelsby Xiaodong Chen, Yuxuan Hu, Jing Zhang, Yanling…