Question answering – Page 5

July 13, 2025

Enhancing Perception Capabilities of Multimodal LLMs with Training-Free Fusionby Zhuokun Chen, Jinwu Hu, Zeshuai Deng,…

July 13, 2025

Learn to Unlearn: Meta-Learning-Based Knowledge Graph Embedding Unlearningby Naixing Xu, Qian Li, Xu Wang, Bingchen…

July 13, 2025

DLaVA: Document Language and Vision Assistant for Answer Localization with Enhanced Interpretability and Trustworthinessby Ahmad…

July 13, 2025

TQA-Bench: Evaluating LLMs for Multi-Table Question Answering with Scalable Context and Symbolic Extensionby Zipeng Qiu,…

July 13, 2025

Cross-modal Information Flow in Multimodal Large Language Modelsby Zhi Zhang, Srishti Yadav, Fengze Han, Ekaterina…

July 13, 2025

GEMeX: A Large-Scale, Groundable, and Explainable Medical VQA Benchmark for Chest X-ray Diagnosisby Bo Liu,…

July 13, 2025

g3D-LF: Generalizable 3D-Language Feature Fields for Embodied Tasksby Zihan Wang, Gim Hee LeeFirst submitted to…

July 13, 2025

ReWind: Understanding Long Videos with Instructed Learnable Memoryby Anxhelo Diko, Tinghuai Wang, Wassim Swaileh, Shiyan…

July 13, 2025

PPLqa: An Unsupervised Information-Theoretic Quality Metric for Comparing Generative Large Language Modelsby Gerald Friedland, Xin…

July 13, 2025

freePruner: A Training-free Approach for Large Multimodal Model Accelerationby Bingxin Xu, Yuzhang Shang, Yunhao Ge,…