GPT – Page 19 – GrooveSquid.com

July 13, 2025

VibeCheck: Discover and Quantify Qualitative Differences in Large Language Modelsby Lisa Dunlap, Krishna Mandal, Trevor…

July 13, 2025

ShapefileGPT: A Multi-Agent Large Language Model Framework for Automated Shapefile Processingby Qingming Lin, Rui Hu,…

July 13, 2025

OmnixR: Evaluating Omni-modality Language Models on Reasoning across Modalitiesby Lichang Chen, Hexiang Hu, Mingda Zhang,…

July 13, 2025

On A Scale From 1 to 5: Quantifying Hallucination in Faithfulness Evaluationby Xiaonan Jing, Srinivas…

July 13, 2025

Kallini et al. (2024) do not compare impossible languages with constituency-based onesby Tim HunterFirst submitted to…

July 13, 2025

VidEgoThink: Assessing Egocentric Video Understanding Capabilities for Embodied AIby Sijie Cheng, Kechen Fang, Yangyang Yu,…

July 13, 2025

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructionsby Yuhan Fu, Ruobing Xie, Jiazhen Liu,…

July 13, 2025

Evidence of Cognitive Deficits andDevelopmental Advances in Generative AI: A Clock Drawing Test Analysisby Isaac…

July 13, 2025

Code-Mixer Ya Nahi: Novel Approaches to Measuring Multilingual LLMs’ Code-Mixing Capabilitiesby Ayushman Gupta, Akhil Bhogal,…

July 13, 2025

In-Context Learning for Long-Context Sentiment Analysis on Infrastructure Project Opinionsby Alireza Shamshiri, Kyeong Rok Ryu,…