Attention – Page 110 – GrooveSquid.com

July 13, 2025

Selective Attention Improves Transformerby Yaniv Leviathan, Matan Kalman, Yossi MatiasFirst submitted to arxiv on: 3…

July 13, 2025

Immunogenicity Prediction with Dual Attention Enables Vaccine Target Selectionby Song Li, Yang Tan, Song Ke,…

July 13, 2025

Deconstructing Recurrence, Attention, and Gating: Investigating the transferability of Transformers and Gated Recurrent Neural Networks…

July 13, 2025

Beyond Squared Error: Exploring Loss Design for Enhanced Training of Generative Flow Networksby Rui Hu,…

July 13, 2025

Listening to the Wise Few: Select-and-Copy Attention Heads for Multiple-Choice QAby Eduard Tulchinskii, Laida Kushnareva,…

July 13, 2025

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Accelerationby Jintao Zhang, Jia wei, Haofeng Huang, Pengle…

July 13, 2025

Training Nonlinear Transformers for Chain-of-Thought Inference: A Theoretical Generalization Analysisby Hongkang Li, Meng Wang, Songtao…

July 13, 2025

HATFormer: Historic Handwritten Arabic Text Recognition with Transformersby Adrian Chan, Anupam Mijar, Mehreen Saeed, Chau-Wai…

July 13, 2025

HyperBrain: Anomaly Detection for Temporal Hypergraph Brain Networksby Sadaf Sadeghian, Xiaoxiao Li, Margo SeltzerFirst submitted…

July 13, 2025

Searching for Efficient Linear Layers over a Continuous Space of Structured Matricesby Andres Potapczynski, Shikai…