LLaMA – Page 39 – GrooveSquid.com

July 13, 2025

Large Language Models as Markov Chainsby Oussama Zekri, Ambroise Odonnat, Abdelhakim Benechehab, Linus Bleistein, Nicolas…

July 13, 2025

Grounding Large Language Models In Embodied Environment With Imperfect World Modelsby Haolan Liu, Jishen ZhaoFirst…

July 13, 2025

LoGra-Med: Long Context Multi-Graph Alignment for Medical Vision-Language Modelby Duy M. H. Nguyen, Nghiem T.…

July 13, 2025

How to Train Long-Context Language Models (Effectively)by Tianyu Gao, Alexander Wettig, Howard Yen, Danqi ChenFirst…

July 13, 2025

CodeJudge: Evaluating Code Generation with Large Language Modelsby Weixi Tong, Tianyi ZhangFirst submitted to arxiv…

July 13, 2025

Automated Red Teaming with GOAT: the Generative Offensive Agent Testerby Maya Pavlova, Erik Brinkman, Krithika…

July 13, 2025

HelpSteer2-Preference: Complementing Ratings with Preferencesby Zhilin Wang, Alexander Bukharin, Olivier Delalleau, Daniel Egert, Gerald Shen,…

July 13, 2025

Sparse Autoencoders Reveal Temporal Difference Learning in Large Language Modelsby Can Demircan, Tankred Saanum, Akshay…

July 13, 2025

Rotated Runtime Smooth: Training-Free Activation Smoother for accurate INT4 inferenceby Ke Yi, Zengke Liu, Jianwei…

July 13, 2025

Scaling Optimal LR Across Token Horizonsby Johan Bjorck, Alon Benhaim, Vishrav Chaudhary, Furu Wei, Xia…