Question answering – Page 31

July 13, 2025

On the Robustness of Language Models for Tabular Question Answeringby Kushal Raj Bhandari, Sixue Xing,…

July 13, 2025

Problem-Solving in Language Model Networksby Ciaran Regan, Alexandre Gournail, Mizuki OkaFirst submitted to arxiv on:…

July 13, 2025

MedCalc-Bench: Evaluating Large Language Models for Medical Calculationsby Nikhil Khandekar, Qiao Jin, Guangzhi Xiong, Soren…

July 13, 2025

Program Synthesis Benchmark for Visual Programming in XLogoOnline Environmentby Chao Wen, Jacqueline Staub, Adish SinglaFirst…

July 13, 2025

TRACE the Evidence: Constructing Knowledge-Grounded Reasoning Chains for Retrieval-Augmented Generationby Jinyuan Fang, Zaiqiao Meng, Craig…

July 13, 2025

Context Graphby Chengjin Xu, Muzhi Li, Cehao Yang, Xuhui Jiang, Lumingyuan Tang, Yiyan Qi, Jian…

July 13, 2025

Balancing Rigor and Utility: Mitigating Cognitive Biases in Large Language Models for Multiple-Choice Questionsby Liman…

July 13, 2025

HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data…

July 13, 2025

CHiSafetyBench: A Chinese Hierarchical Safety Benchmark for Large Language Modelsby Wenjing Zhang, Xuejiao Lei, Zhaoxiang…

July 13, 2025

Efficient Prompting for LLM-based Generative Internet of Thingsby Bin Xiao, Burak Kantarci, Jiawen Kang, Dusit…