Transformer – Page 184 – GrooveSquid.com

July 13, 2025

Accelerating Transformer Pre-training with 2:4 Sparsityby Yuezhou Hu, Kang Zhao, Weiyu Huang, Jianfei Chen, Jun…

July 13, 2025

What Can Transformer Learn with Varying Depth? Case Studies on Sequence Learning Tasksby Xingwu Chen,…

July 13, 2025

Audio Simulation for Sound Source Localization in Virtual Evironmentby Yi Di Yuan, Swee Liang Wong,…

July 13, 2025

Transformer meets wcDTW to improve real-time battery bids: A new approach to scenario selectionby Sujal…

July 13, 2025

ContrastCAD: Contrastive Learning-based Representation Learning for Computer-Aided Design Modelsby Minseop Jung, Minseong Kim, Jibum KimFirst…

July 13, 2025

Prompt-prompted Adaptive Structured Pruning for Efficient LLM Generationby Harry Dong, Beidi Chen, Yuejie ChiFirst submitted…

July 13, 2025

Intelligent Learning Rate Distribution to reduce Catastrophic Forgetting in Transformersby Philip Kenneweg, Alexander Schulz, Sarah…

July 13, 2025

Prompt Learning for Oriented Power Transmission Tower Detection in High-Resolution SAR Imagesby Tianyang Li, Chao…

July 13, 2025

On Difficulties of Attention Factorization through Shared Memoryby Uladzislau Yorsh, Martin Holeňa, Ondřej Bojar, David…

July 13, 2025

A General and Efficient Training for Transformer via Token Expansionby Wenxuan Huang, Yunhang Shen, Jiao…