Cross attention – Page 8 – GrooveSquid.com

July 13, 2025

TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Modelsby Ya-Qi Yu, Minghui Liao, Jihao…

July 13, 2025

CATP: Cross-Attention Token Pruning for Accuracy Preserved Multimodal Model Inferenceby Ruqi Liao, Chuqing Zhao, Jin…

July 13, 2025

Automatic Quantification of Serial PET/CT Images for Pediatric Hodgkin Lymphoma Patients Using a Longitudinally-Aware Segmentation…

July 13, 2025

Playing to Vision Foundation Model’s Strengths in Stereo Matchingby Chuang-Wei Liu, Qijun Chen, Rui FanFirst…

July 13, 2025

OW-VISCapTor: Abstractors for Open-World Video Instance Segmentation and Captioningby Anwesa Choudhuri, Girish Chowdhary, Alexander G.…

July 13, 2025

Cross-domain Fiber Cluster Shape Analysis for Language Performance Cognitive Score Predictionby Yui Lo, Yuqian Chen,…

July 13, 2025

MM-Diff: High-Fidelity Image Personalization via Multi-Modal Condition Integrationby Zhichao Wei, Qingkun Su, Long Qin, Weizhi…

July 13, 2025

Compress3D: a Compressed Latent Space for 3D Generation from a Single Imageby Bowen Zhang, Tianyu…

July 13, 2025

Masked Generative Story Transformer with Character Guidance and Caption Augmentationby Christos Papadimitriou, Giorgos Filandrianos, Maria…

July 13, 2025

PrimeComposer: Faster Progressively Combined Diffusion for Image Composition with Attention Steeringby Yibin Wang, Weizhong Zhang,…