Artificial intelligence – Page 687

July 13, 2025

VEGA: Learning Interleaved Image-Text Comprehension in Vision-Language Large Modelsby Chenyu Zhou, Mengdan Zhang, Peixian Chen,…

July 13, 2025

Object criticality for safer navigationby Andrea Ceccarelli, Leonardo MontecchiFirst submitted to arxiv on: 25 Apr…

July 13, 2025

QCQA: Quality and Capacity-aware grouped Query Attentionby Vinay Joshi, Prashant Laddha, Shambhavi Sinha, Om Ji…

July 13, 2025

Analyzing Gender Polarity in Short Social Media Texts with BERT: The Role of Emojis and…

July 13, 2025

Speech ReaLLM – Real-time Streaming Speech Recognition with Multimodal LLMs by Teaching the Flow of…

July 13, 2025

Multi-Modal Retrieval For Large Language Model Based Speech Recognitionby Jari Kolehmainen, Aditya Gourav, Prashanth Gurunath…

July 13, 2025

DSL-FIQA: Assessing Facial Image Quality via Dual-Set Degradation Learning and Landmark-Guided Transformerby Wei-Ting Chen, Gurunandan…

July 13, 2025

RobustSAM: Segment Anything Robustly on Degraded Imagesby Wei-Ting Chen, Yu-Jiet Vong, Sy-Yen Kuo, Sizhuo Ma,…

July 13, 2025

Learning Language Structures through Groundingby Freda ShiFirst submitted to arxiv on: 14 Jun 2024CategoriesMain: Computation…

July 13, 2025

A Survey of Video Datasets for Grounded Event Understandingby Kate Sanders, Benjamin Van DurmeFirst submitted…