Transformer – Page 63 – GrooveSquid.com

July 13, 2025

Summary of See: Sememe Entanglement Encoding For Transformer-bases Models Compression, by Jing Zhang et al.

SEE: Sememe Entanglement Encoding for Transformer-bases Models Compressionby Jing Zhang, Shuzhen Sun, Peng Zhang, Guangxing…

July 13, 2025

Summary of Edformer: Embedded Decomposition Transformer For Interpretable Multivariate Time Series Predictions, by Sanjay Chakraborty et al.

EDformer: Embedded Decomposition Transformer for Interpretable Multivariate Time Series Predictionsby Sanjay Chakraborty, Ibrahim Delibasoglu, Fredrik…

July 13, 2025

Summary of Emergence Of Abstractions: Concept Encoding and Decoding Mechanism For In-context Learning in Transformers, by Seungwook Han et al.

Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformersby Seungwook Han,…

July 13, 2025

Summary of Krony-pt: Gpt2 Compressed with Kronecker Products, by M. Ayoub Ben Ayad et al.

Krony-PT: GPT2 compressed with Kronecker Productsby M. Ayoub Ben Ayad, Jelena Mitrovic, Michael GranitzerFirst submitted…

July 13, 2025

Summary of Climate Aware Deep Neural Networks (cadnn) For Wind Power Simulation, by Ali Forootani et al.

Climate Aware Deep Neural Networks (CADNN) for Wind Power Simulationby Ali Forootani, Danial Esmaeili Aliabadi,…

July 13, 2025

Summary of No More Adam: Learning Rate Scaling at Initialization Is All You Need, by Minghao Xu et al.

No More Adam: Learning Rate Scaling at Initialization is All You Needby Minghao Xu, Lichuan…

July 13, 2025

Summary of Transformers Use Causal World Models in Maze-solving Tasks, by Alex F. Spies et al.

Transformers Use Causal World Models in Maze-Solving Tasksby Alex F. Spies, William Edwards, Michael I.…

July 13, 2025

Summary of Citrus: Squeezing Extra Performance Out Of Low-data Bio-signal Transfer Learning, by Eloy Geenjaar and Lie Lu

CiTrus: Squeezing Extra Performance out of Low-data Bio-signal Transfer Learningby Eloy Geenjaar, Lie LuFirst submitted…

July 13, 2025

Summary of Understanding Knowledge Hijack Mechanism in In-context Learning Through Associative Memory, by Shuo Wang et al.

Understanding Knowledge Hijack Mechanism in In-context Learning through Associative Memoryby Shuo Wang, Issei SatoFirst submitted…

July 13, 2025

Summary of Notecontrast: Contrastive Language-diagnostic Pretraining For Medical Text, by Prajwal Kailas et al.

NoteContrast: Contrastive Language-Diagnostic Pretraining for Medical Textby Prajwal Kailas, Max Homilius, Rahul C. Deo, Calum…