Inference – Page 244 – GrooveSquid.com

July 13, 2025

On the Compressibility of Quantized Large Language Modelsby Yu Mao, Weilan Wang, Hongchao Du, Nan…

July 13, 2025

LLM-PQ: Serving LLM on Heterogeneous Clusters with Phase-Aware Partition and Adaptive Quantizationby Juntao Zhao, Borui…

July 13, 2025

Inexact Unlearning Needs More Careful Evaluations to Avoid a False Sense of Privacyby Jamie Hayes,…

July 13, 2025

Defending Against Data Reconstruction Attacks in Federated Learning: An Information Theory Approachby Qi Tan, Qi…

July 13, 2025

MALTO at SemEval-2024 Task 6: Leveraging Synthetic Data for LLM Hallucination Detectionby Federico Borra, Claudio…

July 13, 2025

Teaching MLP More Graph Information: A Three-stage Multitask Knowledge Distillation Frameworkby Junxian Li, Bin Shi,…

July 13, 2025

Pairwise Alignment Improves Graph Domain Adaptationby Shikun Liu, Deyu Zou, Han Zhao, Pan LiFirst submitted…

July 13, 2025

Direct Alignment of Draft Model for Speculative Decoding with Chat-Fine-Tuned LLMsby Raghavv Goel, Mukul Gagrani,…

July 13, 2025

Resilience of Entropy Model in Distributed Neural Networksby Milin Zhang, Mohammad Abdi, Shahriar Rifat, Francesco…

July 13, 2025

Stability-Certified Learning of Control Systems with Quadratic Nonlinearitiesby Igor Pontes Duff, Pawan Goyal, Peter BennerFirst…