Self attention – Page 10 – GrooveSquid.com

July 13, 2025

Adversarial Training with OCR Modality Perturbation for Scene-Text Visual Question Answeringby Zhixuan Shen, Haonan Luo,…

July 13, 2025

Language-Driven Visual Consensus for Zero-Shot Semantic Segmentationby Zicheng Zhang, Tong Zhang, Yi Zhu, Jianzhuang Liu,…

July 13, 2025

Gabor-guided transformer for single image derainingby Sijin He, Guangfeng LinFirst submitted to arxiv on: 12…

July 13, 2025

Long-term Frame-Event Visual Tracking: Benchmark Dataset and Baselineby Xiao Wang, Ju Huang, Shiao Wang, Chuanming…

July 13, 2025

StereoDiffusion: Training-Free Stereo Image Generation Using Latent Diffusion Modelsby Lezhong Wang, Jeppe Revall Frisvad, Mark…

July 13, 2025

PrimeComposer: Faster Progressively Combined Diffusion for Image Composition with Attention Steeringby Yibin Wang, Weizhong Zhang,…

July 13, 2025

Modality-Aware and Shift Mixer for Multi-modal Brain Tumor Segmentationby Zhongzhen Huang, Linda Wei, Shaoting Zhang,…

July 13, 2025

Region-Transformer: Self-Attention Region Based Class-Agnostic Point Cloud Segmentationby Dipesh Gyawali, Jian Zhang, BB KarkiFirst submitted…

July 13, 2025

GLFNET: Global-Local (frequency) Filter Networks for efficient medical image segmentationby Athanasios Tragakis, Qianying Liu, Chaitanya…

July 13, 2025

PIDformer: Transformer Meets Control Theoryby Tam Nguyen, César A. Uribe, Tan M. Nguyen, Richard G.…