Transformer – Page 143 – GrooveSquid.com

July 13, 2025

Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysisby Hongkang Li, Meng Wang,…

July 13, 2025

XAMI – A Benchmark Dataset for Artefact Detection in XMM-Newton Optical Imagesby Elisabeta-Iulia Dima, Pablo…

July 13, 2025

Make Graph Neural Networks Great Again: A Generic Integration Paradigm of Topology-Free Patterns for Traffic…

July 13, 2025

MetaGreen: Meta-Learning Inspired Transformer Selection for Green Semantic Communicationby Shubhabrata Mukherjee, Cory Beard, Sejun SongFirst…

July 13, 2025

GeoMFormer: A General Architecture for Geometric Molecular Representation Learningby Tianlang Chen, Shengjie Luo, Di He,…

July 13, 2025

CausalFormer: An Interpretable Transformer for Temporal Causal Discoveryby Lingbai Kong, Wengen Li, Hanchen Yang, Yichao…

July 13, 2025

METRIK: Measurement-Efficient Randomized Controlled Trials using Transformers with Input Maskingby Sayeri Lala, Niraj K. JhaFirst…

July 13, 2025

An All-MLP Sequence Modeling Architecture That Excels at Copyingby Chenwei Cui, Zehao Yan, Gedeon Muhawenayo,…

July 13, 2025

Decentralized Transformers with Centralized Aggregation are Sample-Efficient Multi-Agent World Modelsby Yang Zhang, Chenjia Bai, Bin…

July 13, 2025

Beyond Individual Facts: Investigating Categorical Knowledge Locality of Taxonomy and Meronomy Concepts in GPT Modelsby…