GPT – Page 21 – GrooveSquid.com

July 13, 2025

MMAD: A Comprehensive Benchmark for Multimodal Large Language Models in Industrial Anomaly Detectionby Xi Jiang,…

July 13, 2025

Extended Japanese Commonsense Morality Dataset with Masked Token and Label Enhancementby Takumi Ohashi, Tsubasa Nakagawa,…

July 13, 2025

Transformer-based Language Models for Reasoning in the Description Logic ALCQby Angelos Poulis, Eleni Tsalapati, Manolis…

July 13, 2025

SimpleStrat: Diversifying Language Model Generation with Stratificationby Justin Wong, Yury Orlovskiy, Michael Luo, Sanjit A.…

July 13, 2025

Humanity in AI: Detecting the Personality of Large Language Modelsby Baohua Zhan, Yongyi Huang, Wenyao…

July 13, 2025

Teaching-Inspired Integrated Prompting Framework: A Novel Approach for Enhancing Reasoning in Large Language Modelsby Wenting…

July 13, 2025

MRAG-Bench: Vision-Centric Evaluation for Retrieval-Augmented Multimodal Modelsby Wenbo Hu, Jia-Chen Gu, Zi-Yi Dou, Mohsen Fayyaz,…

July 13, 2025

COMMA: A Communicative Multimodal Multi-Agent Benchmarkby Timothy Ossowski, Jixuan Chen, Danyal Maqbool, Zefan Cai, Tyler…

July 13, 2025

GameTraversalBenchmark: Evaluating Planning Abilities Of Large Language Models Through Traversing 2D Game Mapsby Muhammad Umair…

July 13, 2025

Large Language Models as Code Executors: An Exploratory Studyby Chenyang Lyu, Lecheng Yan, Rui Xing,…