Inference – Page 100 – GrooveSquid.com

July 13, 2025

TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selectionby…

July 13, 2025

Fair In-Context Learning via Latent Concept Variablesby Karuna Bhaila, Minh-Hao Van, Kennedy Edemacu, Chen Zhao,…

July 13, 2025

Point processes with event time uncertaintyby Xiuyuan Cheng, Tingnan Gong, Yao XieFirst submitted to arxiv…

July 13, 2025

Compositional simulation-based inference for time seriesby Manuel Gloeckler, Shoji Toyota, Kenji Fukumizu, Jakob H. MackeFirst…

July 13, 2025

Energy-Aware Dynamic Neural Inferenceby Marcello Bullo, Seifallah Jardak, Pietro Carnelli, Deniz GündüzFirst submitted to arxiv…

July 13, 2025

A Comprehensive Study on Quantization Techniques for Large Language Modelsby Jiedong Lang, Zhehao Guo, Shuyu…

July 13, 2025

TeleOracle: Fine-Tuned Retrieval-Augmented Generation with Long-Context Support for Networkby Nouf Alabbasi, Omar Erak, Omar Alhussein,…

July 13, 2025

“Give Me BF16 or Give Me Death”? Accuracy-Performance Trade-Offs in LLM Quantizationby Eldar Kurtic, Alexandre…

July 13, 2025

MADOD: Generalizing OOD Detection to Unseen Domains via G-Invariance Meta-Learningby Haoliang Wang, Chen Zhao, Feng…

July 13, 2025

SAFE: Slow and Fast Parameter-Efficient Tuning for Continual Learning with Pre-Trained Modelsby Linglan Zhao, Xuerui…