Transformer – Page 164 – GrooveSquid.com

July 13, 2025

Dynamic Mixture of Experts: An Auto-Tuning Approach for Efficient Transformer Modelsby Yongxin Guo, Zhenglin Cheng,…

July 13, 2025

Self-Taught Recognizer: Toward Unsupervised Adaptation for Speech Foundation Modelsby Yuchen Hu, Chen Chen, Chao-Han Huck…

July 13, 2025

Understanding the Training and Generalization of Pretrained Transformer for Sequential Decision Makingby Hanzhao Wang, Yu…

July 13, 2025

Text-to-Model: Text-Conditioned Neural Network Diffusion for Train-Once-for-All Personalizationby Zexi Li, Lingzhi Gao, Chao WuFirst submitted…

July 13, 2025

Transformers Can Learn Temporal Difference Methods for In-Context Reinforcement Learningby Jiuqi Wang, Ethan Blaser, Hadi…

July 13, 2025

Scaling-laws for Large Time-series Modelsby Thomas D. P. Edwards, James Alvey, Justin Alsing, Nam H.…

July 13, 2025

A Versatile Diffusion Transformer with Mixture of Noise Levels for Audiovisual Generationby Gwanghyun Kim, Alonso…

July 13, 2025

Advancing Graph Convolutional Networks via General Spectral Waveletsby Nian Liu, Xiaoxin He, Thomas Laurent, Francesco…

July 13, 2025

Leveraging 2D Information for Long-term Time Series Forecasting with Vanilla Transformersby Xin Cheng, Xiuying Chen,…

July 13, 2025

A Transformer variant for multi-step forecasting of water level and hydrometeorological sensitivity analysis based on…