Inference – Page 180 – GrooveSquid.com

July 13, 2025

Retrieval-Augmented Mixture of LoRA Experts for Uploadable Machine Learningby Ziyu Zhao, Leilei Gan, Guoyin Wang,…

July 13, 2025

EAGLE-2: Faster Inference of Language Models with Dynamic Draft Treesby Yuhui Li, Fangyun Wei, Chao…

July 13, 2025

Flexible Tails for Normalizing Flowsby Tennessee Hickling, Dennis PrangleFirst submitted to arxiv on: 22 Jun…

July 13, 2025

Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformersby Chao Lou,…

July 13, 2025

From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Modelsby Sean Welleck, Amanda Bertsch, Matthew…

July 13, 2025

VICatMix: variational Bayesian clustering and variable selection for discrete biomedical databy Paul D. W. Kirk,…

July 13, 2025

ReCaLL: Membership Inference via Relative Conditional Log-Likelihoodsby Roy Xie, Junlin Wang, Ruomin Huang, Minxing Zhang,…

July 13, 2025

Bounding-Box Inference for Error-Aware Model-Based Reinforcement Learningby Erin J. Talvitie, Zilei Shao, Huiying Li, Jinghan…

July 13, 2025

EDGE-LLM: Enabling Efficient Large Language Model Adaptation on Edge Devices via Layerwise Unified Compression and…

July 13, 2025

Unveiling and Harnessing Hidden Attention Sinks: Enhancing Large Language Models without Training through Attention Calibrationby…