Gemini – Page 10 – GrooveSquid.com

July 13, 2025

Exploring the Capabilities of Large Multimodal Models on Dense Textby Shuo Zhang, Biao Yang, Zhang…

July 13, 2025

Digital Diagnostics: The Potential Of Large Language Models In Recognizing Symptoms Of Common Illnessesby Gaurav…

July 13, 2025

VisionGraph: Leveraging Large Multimodal Models for Graph Theory Problems in Visual Contextby Yunxin Li, Baotian…

July 13, 2025

A Fourth Wave of Open Data? Exploring the Spectrum of Scenarios for Open Data and…

July 13, 2025

LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Modelsby Mihir Parmar, Nisarg…

July 13, 2025

TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Modelsby Ya-Qi Yu, Minghui Liao, Jihao…

July 13, 2025

DesignQA: A Multimodal Benchmark for Evaluating Large Language Models’ Understanding of Engineering Documentationby Anna C.…

July 13, 2025

VisualWebBench: How Far Have Multimodal LLMs Evolved in Web Page Understanding and Grounding?by Junpeng Liu,…

July 13, 2025

IsoBench: Benchmarking Multimodal Foundation Models on Isomorphic Representationsby Deqing Fu, Ruohao Guo, Ghazal Khalighinejad, Ollie…

July 13, 2025

Survey of Bias In Text-to-Image Generation: Definition, Evaluation, and Mitigationby Yixin Wan, Arjun Subramonian, Anaelia…