Scene understanding – Page 6 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Sam-e: Leveraging Visual Foundation Model with Sequence Imitation For Embodied Manipulation, by Junjie Zhang et al.

SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulationby Junjie Zhang, Chenjia Bai,…

July 13, 2025

Summary of Generative Camera Dolly: Extreme Monocular Dynamic Novel View Synthesis, by Basile Van Hoorick et al.

Generative Camera Dolly: Extreme Monocular Dynamic Novel View Synthesisby Basile Van Hoorick, Rundi Wu, Ege…

July 13, 2025

Summary of Pre-trained Text-to-image Diffusion Models Are Versatile Representation Learners For Control, by Gunshi Gupta et al.

Pre-trained Text-to-Image Diffusion Models Are Versatile Representation Learners for Controlby Gunshi Gupta, Karmesh Yadav, Yarin…

July 13, 2025

Summary of Q-groundcam: Quantifying Grounding in Vision Language Models Via Gradcam, by Navid Rajabi et al.

Q-GroundCAM: Quantifying Grounding in Vision Language Models via GradCAMby Navid Rajabi, Jana KoseckaFirst submitted to…

July 13, 2025

Summary of Nerf-mae: Masked Autoencoders For Self-supervised 3d Representation Learning For Neural Radiance Fields, by Muhammad Zubair Irshad et al.

NeRF-MAE: Masked AutoEncoders for Self-Supervised 3D Representation Learning for Neural Radiance Fieldsby Muhammad Zubair Irshad,…

July 13, 2025

Summary of Diffusionmtl: Learning Multi-task Denoising Diffusion Model From Partially Annotated Data, by Hanrong Ye and Dan Xu

DiffusionMTL: Learning Multi-Task Denoising Diffusion Model from Partially Annotated Databy Hanrong Ye, Dan XuFirst submitted…

July 13, 2025

Summary of Instance-warp: Saliency Guided Image Warping For Unsupervised Domain Adaptation, by Shen Zheng et al.

Instance-Warp: Saliency Guided Image Warping for Unsupervised Domain Adaptationby Shen Zheng, Anurag Ghosh, Srinivasa G.…

July 13, 2025

Summary of Learning 3d Object-centric Representation Through Prediction, by John Day et al.

Learning 3D object-centric representation through predictionby John Day, Tushar Arora, Jirui Liu, Li Erran Li,…

July 13, 2025

Summary of Opensun3d: 1st Workshop Challenge on Open-vocabulary 3d Scene Understanding, by Francis Engelmann et al.

OpenSUN3D: 1st Workshop Challenge on Open-Vocabulary 3D Scene Understandingby Francis Engelmann, Ayca Takmaz, Jonas Schult,…