Gemini – Page 13 – GrooveSquid.com

July 13, 2025

Frontier AI systems have surpassed the self-replicating red lineby Xudong Pan, Jiarun Dai, Yihe Fan,…

July 13, 2025

SciFaultyQA: Benchmarking LLMs on Faulty Science Question Detection with a GAN-Inspired Approach to Synthetic Dataset…

July 13, 2025

Frontier Models are Capable of In-context Schemingby Alexander Meinke, Bronson Schoen, Jérémy Scheurer, Mikita Balesni,…

July 13, 2025

LMAct: A Benchmark for In-Context Imitation Learning with Long Multimodal Demonstrationsby Anian Ruoss, Fabio Pardo,…

July 13, 2025

On Limitations of LLM as Annotator for Low Resource Languagesby Suramya Jadhav, Abhay Shanbhag, Amogh…

July 13, 2025

HourVideo: 1-Hour Video-Language Understandingby Keshigeyan Chandrasegaran, Agrim Gupta, Lea M. Hadzic, Taran Kota, Jimming He,…

July 13, 2025

UniGuard: Towards Universal Safety Guardrails for Jailbreak Attacks on Multimodal Large Language Modelsby Sejoon Oh,…

July 13, 2025

BlueSuffix: Reinforced Blue Teaming for Vision-Language Models Against Jailbreak Attacksby Yunhan Zhao, Xiang Zheng, Lin…

July 13, 2025

Sequential Large Language Model-Based Hyper-parameter Optimizationby Kanan Mahammadli, Seyda ErtekinFirst submitted to arxiv on: 27…

July 13, 2025

Aggregated Knowledge Model: Enhancing Domain-Specific QA with Fine-Tuned and Retrieval-Augmented Generation Modelsby Fengchen Liu, Jordan…