Grounding – Page 2 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Evaluating Automated Radiology Report Quality Through Fine-grained Phrasal Grounding Of Clinical Findings, by Razi Mahmood et al.

Evaluating Automated Radiology Report Quality through Fine-Grained Phrasal Grounding of Clinical Findingsby Razi Mahmood, Pingkun…

July 13, 2025

Summary of Dlava: Document Language and Vision Assistant For Answer Localization with Enhanced Interpretability and Trustworthiness, by Ahmad Mohammadshirazi et al.

DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthinessby Ahmad…

July 13, 2025

Summary of Great: Geometry-intention Collaborative Inference For Open-vocabulary 3d Object Affordance Grounding, by Yawen Shao et al.

GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Groundingby Yawen Shao, Wei Zhai, Yuhang…

July 13, 2025

Summary of Showui: One Vision-language-action Model For Gui Visual Agent, by Kevin Qinghong Lin et al.

ShowUI: One Vision-Language-Action Model for GUI Visual Agentby Kevin Qinghong Lin, Linjie Li, Difei Gao,…

July 13, 2025

Summary of Doge: Towards Versatile Visual Document Grounding and Referring, by Yinan Zhou et al.

DOGE: Towards Versatile Visual Document Grounding and Referringby Yinan Zhou, Yuxin Chen, Haokun Lin, Shuyu…

July 13, 2025

Summary of Llm-based Offline Learning For Embodied Agents Via Consistency-guided Reward Ensemble, by Yujeong Lee et al.

LLM-Based Offline Learning for Embodied Agents via Consistency-Guided Reward Ensembleby Yujeong Lee, Sangwoo Shin, Wei-Jin…

July 13, 2025

Summary of Rewind: Understanding Long Videos with Instructed Learnable Memory, by Anxhelo Diko et al.

ReWind: Understanding Long Videos with Instructed Learnable Memoryby Anxhelo Diko, Tinghuai Wang, Wassim Swaileh, Shiyan…

July 13, 2025

Summary of Improved Gui Grounding Via Iterative Narrowing, by Anthony Nguyen

Improved GUI Grounding via Iterative Narrowingby Anthony NguyenFirst submitted to arxiv on: 18 Nov 2024CategoriesMain:…

July 13, 2025

Summary of Motion-grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level, by Andong Deng et al.

Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Levelby Andong Deng, Tongjia Chen, Shoubin…