Transformer – Page 76 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Stable Flow: Vital Layers For Training-free Image Editing, by Omri Avrahami et al.

Stable Flow: Vital Layers for Training-Free Image Editingby Omri Avrahami, Or Patashnik, Ohad Fried, Egor…

July 13, 2025

Summary of Generative Fuzzy System For Sequence Generation, by Hailong Yang et al.

Generative Fuzzy System for Sequence Generationby Hailong Yang, Zhaohong Deng, Wei Zhang, Zhuangzhuang Zhao, Guanjin…

July 13, 2025

Summary of Hymba: a Hybrid-head Architecture For Small Language Models, by Xin Dong et al.

Hymba: A Hybrid-head Architecture for Small Language Modelsby Xin Dong, Yonggan Fu, Shizhe Diao, Wonmin…

July 13, 2025

Summary of Transformers with Sparse Attention For Granger Causality, by Riya Mahesh et al.

Transformers with Sparse Attention for Granger Causalityby Riya Mahesh, Rahul Vashisht, Chandrashekar LakshminarayananFirst submitted to…

July 13, 2025

Summary of Synehrgy: Synthesizing Mixed-type Structured Electronic Health Records Using Decoder-only Transformers, by Hojjat Karami et al.

SynEHRgy: Synthesizing Mixed-Type Structured Electronic Health Records using Decoder-Only Transformersby Hojjat Karami, David Atienza, Anisoara…

July 13, 2025

Summary of Selective Attention: Enhancing Transformer Through Principled Context Control, by Xuechen Zhang et al.

Selective Attention: Enhancing Transformer through Principled Context Controlby Xuechen Zhang, Xiangyu Chang, Mingchen Li, Amit…

July 13, 2025

Summary of Uniflow: a Foundation Model For Unified Urban Spatio-temporal Flow Prediction, by Yuan Yuan et al.

UniFlow: A Foundation Model for Unified Urban Spatio-Temporal Flow Predictionby Yuan Yuan, Jingtao Ding, Chonghua…

July 13, 2025

Summary of Dlbacktrace: a Model Agnostic Explainability For Any Deep Learning Models, by Vinay Kumar Sankarapu et al.

DLBacktrace: A Model Agnostic Explainability for any Deep Learning Modelsby Vinay Kumar Sankarapu, Chintan Chitroda,…

July 13, 2025

Summary of Ultra-sparse Memory Network, by Zihao Huang et al.

Ultra-Sparse Memory Networkby Zihao Huang, Qiyang Min, Hongzhi Huang, Defa Zhu, Yutao Zeng, Ran Guo,…

July 13, 2025

Summary of Comparing Prior and Learned Time Representations in Transformer Models Of Timeseries, by Natalia Koliou et al.

Comparing Prior and Learned Time Representations in Transformer Models of Timeseriesby Natalia Koliou, Tatiana Boura,…