Self attention – Page 37 – GrooveSquid.com

July 13, 2025

LLM Maybe LongLM: Self-Extend LLM Context Window Without Tuningby Hongye Jin, Xiaotian Han, Jingfeng Yang,…

July 13, 2025

SwapTransformer: highway overtaking tactical planner model via imitation learning on OSHA datasetby Alireza Shamsoshoara, Safin…

July 13, 2025

MSGNet: Learning Multi-Scale Inter-Series Correlations for Multivariate Time Series Forecastingby Wanlin Cai, Yuxuan Liang, Xianggen…

July 13, 2025

Detecting out-of-distribution text using topological features of transformer-based language modelsby Andres Pollano, Anupam Chaudhuri, Anj…

July 13, 2025

De-SaTE: Denoising Self-attention Transformer Encoders for Li-ion Battery Health Prognosticsby Gaurav Shinde, Rohan Mohapatra, Pooja…

July 13, 2025

Attention-free Spikformer: Mixing Spike Sequences with Simple Linear Transformsby Qingyu Wang, Duzhen Zhang, Tielin Zhang,…

July 13, 2025

Attention Augmented Convolutional Networksby Irwan Bello, Barret Zoph, Ashish Vaswani, Jonathon Shlens, Quoc V. LeFirst…