GPT – Page 50 – GrooveSquid.com

July 13, 2025

MuirBench: A Comprehensive Benchmark for Robust Multi-image Understandingby Fei Wang, Xingyu Fu, James Y. Huang,…

July 13, 2025

GPT-ology, Computational Models, Silicon Sampling: How should we think about LLMs in Cognitive Science?by Desmond…

July 13, 2025

A Sociotechnical Lens for Evaluating Computer Vision Models: A Case Study on Detecting and Reasoning…

July 13, 2025

Tailoring Generative AI Chatbots for Multiethnic Communities in Disaster Preparedness Communication: Extending the CASA Paradigmby…

July 13, 2025

Language Model Council: Democratically Benchmarking Foundation Models on Highly Subjective Tasksby Justin Zhao, Flor Miriam…

July 13, 2025

Open-LLM-Leaderboard: From Multi-choice to Open-style Questions for LLMs Evaluation, Benchmark, and Arenaby Aidar Myrzakhan, Sondos…

July 13, 2025

Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?by Xingyu Fu, Muyu He, Yujie Lu, William…

July 13, 2025

MLLMGuard: A Multi-dimensional Safety Evaluation Suite for Multimodal Large Language Modelsby Tianle Gu, Zeyang Zhou,…

July 13, 2025

Are Large Language Models Good Statisticians?by Yizhang Zhu, Shiyin Du, Boyan Li, Yuyu Luo, Nan…

July 13, 2025

T2S-GPT: Dynamic Vector Quantization for Autoregressive Sign Language Production from Textby Aoxiong Yin, Haoyuan Li,…