GPT – Page 91 – GrooveSquid.com

July 13, 2025

HashAttention: Semantic Sparsity for Faster Inferenceby Aditya Desai, Shuo Yang, Alejandro Cuadron, Ana Klimovic, Matei…

July 13, 2025

FaultExplainer: Leveraging Large Language Models for Interpretable Fault Detection and Diagnosisby Abdullah Khan, Rahul Nahar,…

July 13, 2025

Mix-LN: Unleashing the Power of Deeper Layers by Combining Pre-LN and Post-LNby Pengxiang Li, Lu…

July 13, 2025

Lightweight Safety Classification Using Pruned Language Modelsby Mason Sawtell, Tula Masterman, Sandi Besen, Jim BrownFirst…

July 13, 2025

Towards LLM-based optimization compilers. Can LLMs learn how to apply a single peephole optimization? Reasoning…

July 13, 2025

The Open Source Advantage in Large Language Models (LLMs)by Jiya Manchanda, Laura Boettcher, Matheus Westphalen,…

July 13, 2025

Frontier AI systems have surpassed the self-replicating red lineby Xudong Pan, Jiarun Dai, Yihe Fan,…

July 13, 2025

No More Adam: Learning Rate Scaling at Initialization is All You Needby Minghao Xu, Lichuan…

July 13, 2025

SciFaultyQA: Benchmarking LLMs on Faulty Science Question Detection with a GAN-Inspired Approach to Synthetic Dataset…

July 13, 2025

SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Modelsby Jiale Cheng, Xiao…