Self attention – Page 25 – GrooveSquid.com

July 13, 2025

Quest: Query-Aware Sparsity for Efficient Long-Context LLM Inferenceby Jiaming Tang, Yilong Zhao, Kan Zhu, Guangxuan…

July 13, 2025

L4GM: Large 4D Gaussian Reconstruction Modelby Jiawei Ren, Kevin Xie, Ashkan Mirzaei, Hanxue Liang, Xiaohui…

July 13, 2025

Large Language Models as Interpolated and Extrapolated Event Predictorsby Libo Zhang, Yue NingFirst submitted to…

July 13, 2025

ECGMamba: Towards Efficient ECG Classification with BiSSMby Yupeng Qiang, Xunde Dong, Xiuling Liu, Yang Yang,…

July 13, 2025

Inverse Probability of Treatment Weighting with Deep Sequence Models Enables Accurate treatment effect Estimation from…

July 13, 2025

Self-attention-based non-linear basis transformations for compact latent space modelling of dynamic optical fibre transmission matricesby…

July 13, 2025

Non-autoregressive Personalized Bundle Generationby Wenchuan Yang, Cheng Yang, Jichao Li, Yuejin Tan, Xin Lu, Chuan…

July 13, 2025

CMamba: Channel Correlation Enhanced State Space Models for Multivariate Time Series Forecastingby Chaolv Zeng, Zhanyu…

July 13, 2025

Efficient 3D Shape Generation via Diffusion Mamba with Bidirectional SSMsby Shentong MoFirst submitted to arxiv…

July 13, 2025

Faithful and Accurate Self-Attention Attribution for Message Passing Neural Networks via the Computation Tree Viewpointby…