Decoder – Page 8 – GrooveSquid.com

July 13, 2025

Language Model Can Listen While Speakingby Ziyang Ma, Yakun Song, Chenpeng Du, Jian Cong, Zhuo…

July 13, 2025

ParkingE2E: Camera-based End-to-end Parking Network, from Images to Planningby Changze Li, Ziheng Ji, Zhe Chen,…

July 13, 2025

WAS: Dataset and Methods for Artistic Text Segmentationby Xudong Xie, Yuzhe Li, Yang Liu, Zhifei…

July 13, 2025

AI Safety in Practice: Enhancing Adversarial Robustness in Multimodal Image Captioningby Maisha Binte Rashid, Pablo…

July 13, 2025

Rethinking RGB-D Fusion for Semantic Segmentation in Surgical Datasetsby Muhammad Abdullah Jamal, Omid MohareriFirst submitted…

July 13, 2025

GaussianSR: High Fidelity 2D Gaussian Splatting for Arbitrary-Scale Image Super-Resolutionby Jintong Hu, Bin Xia, Bin…

July 13, 2025

Improving Domain-Specific ASR with LLM-Generated Contextual Descriptionsby Jiwon Suh, Injae Na, Woohwan JungFirst submitted to…

July 13, 2025

ALLaM: Large Language Models for Arabic and Englishby M Saiful Bari, Yazeed Alnumay, Norah A.…

July 13, 2025

Qalam : A Multimodal LLM for Arabic Optical Character and Handwriting Recognitionby Gagan Bhatia, El…

July 13, 2025

Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and…