Token – Page 59 – GrooveSquid.com

July 13, 2025

LookupViT: Compressing visual information to a limited number of tokensby Rajat Koner, Gagan Jain, Prateek…

July 13, 2025

MEMO: Fine-grained Tensor Management For Ultra-long Context LLM Trainingby Pinxue Zhao, Hailin Zhang, Fangcheng Fu,…

July 13, 2025

Understanding Transformers via N-gram Statisticsby Timothy NguyenFirst submitted to arxiv on: 30 Jun 2024CategoriesMain: Computation…

July 13, 2025

PipeInfer: Accelerating LLM Inference using Asynchronous Pipelined Speculationby Branden Butler, Sixing Yu, Arya Mazaheri, Ali…

July 13, 2025

Counting in Small Transformers: The Delicate Interplay between Attention and Feed-Forward Layersby Freya Behrens, Luca…

July 13, 2025

MoESD: Mixture of Experts Stable Diffusion to Mitigate Gender Biasby Guorun Wang, Lucia SpeciaFirst submitted…

July 13, 2025

LLM Circuit Analyses Are Consistent Across Training and Scaleby Curt Tigges, Michael Hanna, Qinan Yu,…

July 13, 2025

Accessing Vision Foundation Models via ImageNet-1Kby Yitian Zhang, Xu Ma, Yue Bai, Huan Wang, Yun…

July 13, 2025

By My Eyes: Grounding Multimodal Large Language Models with Sensor Data via Visual Promptingby Hyungjun…

July 13, 2025

Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inferenceby Zongyue Qin, Ziniu Hu, Zifan…