Gemini – Page 4 – GrooveSquid.com

July 13, 2025

Assessing the Creativity of LLMs in Proposing Novel Solutions to Mathematical Problemsby Junyi Ye, Jingyi…

July 13, 2025

Evaluating AI-Generated Essays with GRE Analytical Writing Assessmentby Yang Zhong, Jiangang Hao, Michael Fauss, Chen…

July 13, 2025

Revealing Hidden Bias in AI: Lessons from Large Language Modelsby Django Beatty, Kritsada Masanthia, Teepakorn…

July 13, 2025

Polymath: A Challenging Multi-modal Mathematical Reasoning Benchmarkby Himanshu Gupta, Shreyas Verma, Ujjwala Anantheswaran, Kevin Scaria,…

July 13, 2025

TimeSeriesExam: A time series understanding examby Yifu Cai, Arjun Choudhry, Mononito Goswami, Artur DubrawskiFirst submitted…

July 13, 2025

MIRROR: A Novel Approach for the Automated Evaluation of Open-Ended Question Generationby Aniket Deroy, Subhankar…

July 13, 2025

Evaluating Morphological Compositional Generalization in Large Language Modelsby Mete Ismayilzada, Defne Circi, Jonne Sälevä, Hale…

July 13, 2025

OmnixR: Evaluating Omni-modality Language Models on Reasoning across Modalitiesby Lichang Chen, Hexiang Hu, Mingda Zhang,…

July 13, 2025

Magnifier Prompt: Tackling Multimodal Hallucination via Extremely Simple Instructionsby Yuhan Fu, Ruobing Xie, Jiazhen Liu,…

July 13, 2025

Evidence of Cognitive Deficits andDevelopmental Advances in Generative AI: A Clock Drawing Test Analysisby Isaac…