Multi modal – Page 5 – GrooveSquid.com

July 13, 2025

Multi-Modal Forecaster: Jointly Predicting Time Series and Textual Databy Kai Kim, Howard Tsai, Rajat Sen,…

July 13, 2025

Multi-Modal interpretable automatic video captioningby Antoine Hanna-Asaad, Decky Aspandi, Titus ZahariaFirst submitted to arxiv on:…

July 13, 2025

Multi-modal Iterative and Deep Fusion Frameworks for Enhanced Passive DOA Sensing via a Green Massive…

July 13, 2025

Personalize to generalize: Towards a universal medical multi-modality generalization through personalizationby Zhaorui Tan, Xi Yang,…

July 13, 2025

LLM-PySC2: Starcraft II learning environment for Large Language Modelsby Zongyuan Li, Yanan Ni, Runnan Qi,…

July 13, 2025

M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understandingby Jaemin Cho, Debanjan Mahata,…

July 13, 2025

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Modelsby Chuhan Li, Ziyao Shangguan,…

July 13, 2025

Enhancing Indoor Mobility with Connected Sensor Nodes: A Real-Time, Delay-Aware Cooperative Perception Approachby Minghao Ning,…

July 13, 2025

A Simple and Effective Temporal Grounding Pipeline for Basketball Broadcast Footageby Levi HarrisFirst submitted to…

July 13, 2025

Enhancing Osteoporosis Detection: An Explainable Multi-Modal Learning Framework with Feature Fusion and Variable Clusteringby Mehdi…