Latent space – Page 6 – GrooveSquid.com

July 13, 2025

Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Modelsby Athanasios Tragakis, Marco…

July 13, 2025

Efficient 3D-Aware Facial Image Editing via Attribute-Specific Prompt Learningby Amandeep Kumar, Muhammad Awais, Sanath Narayan,…

July 13, 2025

SNED: Superposition Network Architecture Search for Efficient Video Diffusion Modelby Zhengang Li, Yan Kang, Yuchen…

July 13, 2025

CV-VAE: A Compatible Video VAE for Latent Generative Video Modelsby Sijie Zhao, Yong Zhang, Xiaodong…

July 13, 2025

Exploring Alignment in Shared Cross-lingual Spacesby Basel Mousi, Nadir Durrani, Fahim Dalvi, Majd Hawasly, Ahmed…

July 13, 2025

NeuroGauss4D-PCI: 4D Neural Fields and Gaussian Deformation Fields for Point Cloud Interpolationby Chaokang Jiang, Dalong…

July 13, 2025

SwapTalk: Audio-Driven Talking Face Generation with One-Shot Customization in Latent Spaceby Zeren Zhang, Haibo Qin,…

July 13, 2025

Long Tail Image Generation Through Feature Space Augmentation and Iterated Learningby Rafael Elberg, Denis Parra,…

July 13, 2025

Contextual Categorization Enhancement through LLMs Latent-Spaceby Zineddine Bettouche, Anas Safi, Andreas FischerFirst submitted to arxiv…

July 13, 2025

LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation?by Yuchi Wang, Shuhuai…