Token – Page 43 – GrooveSquid.com

July 13, 2025

MrT5: Dynamic Token Merging for Efficient Byte-level Language Modelsby Julie Kallini, Shikhar Murty, Christopher D.…

July 13, 2025

Looking Beyond The Top-1: Transformers Determine Top Tokens In Orderby Daria Lioubashevski, Tomer Schlank, Gabriel…

July 13, 2025

Dynamic Vocabulary Pruning in Early-Exit LLMsby Jort Vincenti, Karim Abdel Sadek, Joan Velja, Matteo Nulli,…

July 13, 2025

Probabilistic Language-Image Pre-Trainingby Sanghyuk Chun, Wonjae Kim, Song Park, Sangdoo YunFirst submitted to arxiv on:…

July 13, 2025

Multi-Draft Speculative Sampling: Canonical Architectures and Theoretical Limitsby Ashish Khisti, M.Reza Ebrahimi, Hassan Dbouk, Arash…

July 13, 2025

AdaEDL: Early Draft Stopping for Speculative Decoding of Large Language Models via an Entropy-based Lower…

July 13, 2025

Future Token Prediction – Causal Language Modelling with Per-Token Semantic State Vector for Multi-Token Predictionby…

July 13, 2025

Faster Language Models with Better Multi-Token Prediction Using Tensor Decompositionby Artem Basharin, Andrei Chertkov, Ivan…

July 13, 2025

AMUSD: Asynchronous Multi-Device Speculative Decoding for LLM Accelerationby Bradley McDanelFirst submitted to arxiv on: 22…

July 13, 2025

TreeBoN: Enhancing Inference-Time Alignment with Speculative Tree-Search and Best-of-N Samplingby Jiahao Qiu, Yifu Lu, Yifan…