Transformer – Page 153 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Population Transformer: Learning Population-level Representations Of Neural Activity, by Geeling Chau et al.

Population Transformer: Learning Population-level Representations of Neural Activityby Geeling Chau, Christopher Wang, Sabera Talukder, Vighnesh…

July 13, 2025

Summary of Local to Global: Learning Dynamics and Effect Of Initialization For Transformers, by Ashok Vardhan Makkuva et al.

Local to Global: Learning Dynamics and Effect of Initialization for Transformersby Ashok Vardhan Makkuva, Marco…

July 13, 2025

Summary of Short-term Inland Vessel Trajectory Prediction with Encoder-decoder Models, by Kathrin Donandt et al.

Short-term Inland Vessel Trajectory Prediction with Encoder-Decoder Modelsby Kathrin Donandt, Karim Böttger, Dirk SöffkerFirst submitted…

July 13, 2025

Summary of Improved Context-sensitive Transformer Model For Inland Vessel Trajectory Prediction, by Kathrin Donandt et al.

Improved context-sensitive transformer model for inland vessel trajectory predictionby Kathrin Donandt, Karim Böttger, Dirk SöffkerFirst…

July 13, 2025

Summary of Exact Conversion Of In-context Learning to Model Weights in Linearized-attention Transformers, by Brian K Chen et al.

Exact Conversion of In-Context Learning to Model Weights in Linearized-Attention Transformersby Brian K Chen, Tianyang…

July 13, 2025

Summary of Block Transformer: Global-to-local Language Modeling For Fast Inference, by Namgyu Ho et al.

Block Transformer: Global-to-Local Language Modeling for Fast Inferenceby Namgyu Ho, Sangmin Bae, Taehyeon Kim, Hyunjik…

July 13, 2025

Summary of Multi-layer Learnable Attention Mask For Multimodal Tasks, by Wayner Barrios and Souyoung Jin

Multi-layer Learnable Attention Mask for Multimodal Tasksby Wayner Barrios, SouYoung JinFirst submitted to arxiv on:…

July 13, 2025

Summary of Contextual Counting: a Mechanistic Study Of Transformers on a Quantitative Task, by Siavash Golkar et al.

Contextual Counting: A Mechanistic Study of Transformers on a Quantitative Taskby Siavash Golkar, Alberto Bietti,…

July 13, 2025

Summary of A Temporal Kolmogorov-arnold Transformer For Time Series Forecasting, by Remi Genet and Hugo Inzirillo

A Temporal Kolmogorov-Arnold Transformer for Time Series Forecastingby Remi Genet, Hugo InzirilloFirst submitted to arxiv…

July 13, 2025

Summary of Towards Efficient Mixture Of Experts: a Holistic Study Of Compression Techniques, by Shwai He et al.

Towards Efficient Mixture of Experts: A Holistic Study of Compression Techniquesby Shwai He, Daize Dong,…