Token – Page 33 – GrooveSquid.com

July 13, 2025

Token-Budget-Aware LLM Reasoningby Tingxu Han, Zhenting Wang, Chunrong Fang, Shiyu Zhao, Shiqing Ma, Zhenyu ChenFirst…

July 13, 2025

Next Token Prediction Towards Multimodal Intelligence: A Comprehensive Surveyby Liang Chen, Zekun Wang, Shuhuai Ren,…

July 13, 2025

RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Predictionby Xiaoping Wu, Jie Hu, Xiaoming WeiFirst…

July 13, 2025

Token Statistics Transformer: Linear-Time Attention via Variational Rate Reductionby Ziyang Wu, Tianjiao Ding, Yifu Lu,…

July 13, 2025

Fast Gradient Computation for RoPE Attention in Almost Linear Timeby Yifang Chen, Jiayan Huo, Xiaoyu…

July 13, 2025

Distilled Decoding 1: One-step Sampling of Image Auto-regressive Models with Flow Matchingby Enshu Liu, Xuefei…

July 13, 2025

Enhancing Item Tokenization for Generative Recommendation through Self-Improvementby Runjin Chen, Mingxuan Ju, Ngoc Bui, Dimosthenis…

July 13, 2025

Layer- and Timestep-Adaptive Differentiable Token Compression Ratios for Efficient Diffusion Transformersby Haoran You, Connelly Barnes,…

July 13, 2025

When Worse is Better: Navigating the compression-generation tradeoff in visual tokenizationby Vivek Ramanujan, Kushal Tirumala,…

July 13, 2025

HashEvict: A Pre-Attention KV Cache Eviction Strategy using Locality-Sensitive Hashingby Minghui Liu, Tahseen Rabbani, Tony…