Multi modal – Page 25 – GrooveSquid.com

July 13, 2025

Efficient Vision-and-Language Pre-training with Text-Relevant Image Patch Selectionby Wei Ye, Chaoya Jiang, Haiyang Xu, Chenhao…

July 13, 2025

VLKEB: A Large Vision-Language Model Knowledge Editing Benchmarkby Han Huang, Haitian Zhong, Tao Yu, Qiang…

July 13, 2025

Noise-powered Multi-modal Knowledge Graph Representation Frameworkby Zhuo Chen, Yin Fang, Yichi Zhang, Lingbing Guo, Jiaoyan…

July 13, 2025

MOAB: Multi-Modal Outer Arithmetic Block For Fusion Of Histopathological Images And Genetic Data For Brain…

July 13, 2025

How Well Do Multi-modal LLMs Interpret CT Scans? An Auto-Evaluation Framework for Analysesby Qingqing Zhu,…

July 13, 2025

MMoE: Robust Spoiler Detection with Multi-modal Information and Domain-aware Mixture-of-Expertsby Zinan Zeng, Sen Ye, Zijian…

July 13, 2025

A Privacy-Preserving Framework with Multi-Modal Data for Cross-Domain Recommendationby Li Wang, Lei Sang, Quangui Zhang,…

July 13, 2025

Data Augmentation using Large Language Models: Data Perspectives, Learning Paradigms and Challengesby Bosheng Ding, Chengwei…

July 13, 2025

Abductive Ego-View Accident Video Understanding for Safe Driving Perceptionby Jianwu Fang, Lei-lei Li, Junfei Zhou,…

July 13, 2025

GenAINet: Enabling Wireless Collective Intelligence via Knowledge Transfer and Reasoningby Hang Zou, Qiyang Zhao, Lina…