LLaMA – Page 35 – GrooveSquid.com

July 13, 2025

Model Equality Testing: Which Model Is This API Serving?by Irena Gao, Percy Liang, Carlos GuestrinFirst…

July 13, 2025

Two are better than one: Context window extension with multi-grained self-injectionby Wei Han, Pan Zhou,…

July 13, 2025

TesseraQ: Ultra Low-Bit LLM Post-Training Quantization with Block Reconstructionby Yuhang Li, Priyadarshini PandaFirst submitted to…

July 13, 2025

Knowledge Distillation Using Frontier Open-source LLMs: Generalizability and the Role of Synthetic Databy Anup Shirgaonkar,…

July 13, 2025

Prompting and Fine-Tuning of Small LLMs for Length-Controllable Telephone Call Summarizationby David Thulke, Yingbo Gao,…

July 13, 2025

Beware of Calibration Data for Pruning Large Language Modelsby Yixin Ji, Yang Xiang, Juntao Li,…

July 13, 2025

Representation Shattering in Transformers: A Synthetic Study with Knowledge Editingby Kento Nishi, Maya Okawa, Rahul…

July 13, 2025

FastAttention: Extend FlashAttention2 to NPUs and Low-resource GPUsby Haoran Lin, Xianzhi Yu, Kang Zhao, Lu…

July 13, 2025

Large Language Models in Computer Science Education: A Systematic Literature Reviewby Nishat Raihan, Mohammed Latif…

July 13, 2025

Natural GaLore: Accelerating GaLore for memory-efficient LLM Training and Fine-tuningby Arijit DasFirst submitted to arxiv…