Autoregressive – Page 27 – GrooveSquid.com

July 13, 2025

Unified Text-to-Image Generation and Retrievalby Leigang Qu, Haochuan Li, Tan Wang, Wenjie Wang, Yongqi Li,…

July 13, 2025

Lifelong Learning of Video Diffusion Models From a Single Video Streamby Jason Yoo, Yingchen He,…

July 13, 2025

Multifidelity digital twin for real-time monitoring of structural dynamics in aquaculture net cagesby Eirini Katsidoniotaki,…

July 13, 2025

Simplified and Generalized Masked Diffusion for Discrete Databy Jiaxin Shi, Kehang Han, Zhe Wang, Arnaud…

July 13, 2025

Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Databy Jingyang Ou, Shen…

July 13, 2025

What Should Embeddings Embed? Autoregressive Models Represent Latent Generating Distributionsby Liyi Zhang, Michael Y. Li,…

July 13, 2025

Block Transformer: Global-to-Local Language Modeling for Fast Inferenceby Namgyu Ho, Sangmin Bae, Taehyeon Kim, Hyunjik…

July 13, 2025

Pretrained Mobility Transformer: A Foundation Model for Human Mobilityby Xinhua Wu, Haoyu He, Yanchao Wang,…

July 13, 2025

Dual Process Learning: Controlling Use of In-Context vs. In-Weights Strategies with Weight Forgettingby Suraj Anand, Michael…

July 13, 2025

Arbitrary-Length Generalization for Addition in a Tiny Transformerby Alexandre Galvao PatriotaFirst submitted to arxiv on:…