Transformer – Page 104 – GrooveSquid.com

July 13, 2025

Pyramidal Flow Matching for Efficient Video Generative Modelingby Yang Jin, Zhicheng Sun, Ningyuan Li, Kun…

July 13, 2025

TimeDART: A Diffusion Autoregressive Transformer for Self-Supervised Time Series Representationby Daoyu Wang, Mingyue Cheng, Zhiding…

July 13, 2025

LevAttention: Time, Space, and Streaming Efficient Algorithm for Heavy Attentionsby Ravindran Kannan, Chiranjib Bhattacharyya, Praneeth…

July 13, 2025

Transformers learn variable-order Markov chains in-contextby Ruida Zhou, Chao Tian, Suhas DiggaviFirst submitted to arxiv…

July 13, 2025

Chain and Causal Attention for Efficient Entity Trackingby Erwan Fagnou, Paul Caillon, Blaise Delattre, Alexandre…

July 13, 2025

Differential Transformerby Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu…

July 13, 2025

DEPT: Decoupled Embeddings for Pre-training Language Modelsby Alex Iacob, Lorenzo Sani, Meghdad Kurmanji, William F.…

July 13, 2025

TidalDecode: Fast and Accurate LLM Decoding with Position Persistent Sparse Attentionby Lijie Yang, Zhihao Zhang,…

July 13, 2025

Timer-XL: Long-Context Transformers for Unified Time Series Forecastingby Yong Liu, Guo Qin, Xiangdong Huang, Jianmin…

July 13, 2025

TimeCNN: Refining Cross-Variable Interaction on Time Point for Time Series Forecastingby Ao Hu, Dongkai Wang,…