LLaMA – Page 31 – GrooveSquid.com

July 13, 2025

DENIAHL: In-Context Features Influence LLM Needle-In-A-Haystack Abilitiesby Hui Dai, Dan Pechi, Xinyi Yang, Garvit Banga,…

July 13, 2025

Training and Evaluating Language Models with Template-based Data Generationby Yifan ZhangFirst submitted to arxiv on:…

July 13, 2025

Pushing the Limits of Large Language Model Quantization via the Linearity Theoremby Vladimir Malinovskii, Andrei…

July 13, 2025

On Limitations of LLM as Annotator for Low Resource Languagesby Suramya Jadhav, Abhay Shanbhag, Amogh…

July 13, 2025

CLOVER: Cross-Layer Orthogonal Vectors Pruning and Fine-Tuningby Fanxu Meng, Pingzhi Tang, Fan jiang, Muhan ZhangFirst…

July 13, 2025

Cautious Optimizers: Improving Training with One Line of Codeby Kaizhao Liang, Lizhang Chen, Bo Liu,…

July 13, 2025

Hymba: A Hybrid-head Architecture for Small Language Modelsby Xin Dong, Yonggan Fu, Shizhe Diao, Wonmin…

July 13, 2025

Evaluating LLMs Capabilities Towards Understanding Social Dynamicsby Anique Tahir, Lu Cheng, Manuel Sandoval, Yasin N.…

July 13, 2025

Deriving Activation Functions Using Integrationby Allen Hao Huang, Imanol SchlagFirst submitted to arxiv on: 20…

July 13, 2025

CROW: Eliminating Backdoors from Large Language Models via Internal Consistency Regularizationby Nay Myat Min, Long…