Inference – Page 191 – GrooveSquid.com

July 13, 2025

DHA: Learning Decoupled-Head Attention from Transformer Checkpoints via Adaptive Heads Fusionby Yilong Chen, Linhao Zhang,…

July 13, 2025

LLM Dataset Inference: Did you train on my dataset?by Pratyush Maini, Hengrui Jia, Nicolas Papernot,…

July 13, 2025

Foundation Inference Models for Markov Jump Processesby David Berghaus, Kostadin Cvejoski, Patrick Seifner, Cesar Ojeda,…

July 13, 2025

Decoupled Marked Temporal Point Process using Neural Ordinary Differential Equationsby Yujee Song, Donghyun Lee, Rui…

July 13, 2025

Efficient Neural Compression with Inference-time Decodingby C. Metz, O. Bichler, A. DupretFirst submitted to arxiv…

July 13, 2025

PowerInfer-2: Fast Large Language Model Inference on a Smartphoneby Zhenliang Xue, Yixin Song, Zeyu Mi,…

July 13, 2025

Turbo Sparse: Achieving LLM SOTA Performance with Minimal Activated Parametersby Yixin Song, Haotong Xie, Zhengyan…

July 13, 2025

GraphStorm: all-in-one graph machine learning framework for industry applicationsby Da Zheng, Xiang Song, Qi Zhu,…

July 13, 2025

PSBD: Prediction Shift Uncertainty Unlocks Backdoor Detectionby Wei Li, Pin-Yu Chen, Sijia Liu, Ren WangFirst…

July 13, 2025

Scaling Graph Convolutions for Mobile Visionby William Avery, Mustafa Munir, Radu MarculescuFirst submitted to arxiv…