LLaMA – Page 30 – GrooveSquid.com

July 13, 2025

Extractive Structures Learned in Pretraining Enable Generalization on Finetuned Factsby Jiahai Feng, Stuart Russell, Jacob…

July 13, 2025

SKIM: Any-bit Quantization Pushing The Limits of Post-Training Quantizationby Runsheng Bai, Bo Liu, Qiang LiuFirst…

July 13, 2025

A Water Efficiency Dataset for African Data Centersby Noah Shumba, Opelo Tshekiso, Pengfei Li, Giulia…

July 13, 2025

Enhancing CLIP Conceptual Embedding through Knowledge Distillationby Kuei-Chun KaoFirst submitted to arxiv on: 4 Dec…

July 13, 2025

FANAL – Financial Activity News Alerting Language Modeling Frameworkby Urjitkumar Patel, Fang-Chun Yeh, Chinmay Gondhalekar,…

July 13, 2025

Evaluating Gender Bias Transfer between Pre-trained and Prompt-Adapted Language Modelsby Natalie Mackraz, Nivedha Sivakumar, Samira…

July 13, 2025

CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMsby Abhas Kumar,…

July 13, 2025

RILQ: Rank-Insensitive LoRA-based Quantization Error Compensation for Boosting 2-bit Large Language Model Accuracyby Geonho Lee,…

July 13, 2025

COAP: Memory-Efficient Training with Correlation-Aware Gradient Projectionby Jinqi Xiao, Shen Sang, Tiancheng Zhi, Jing Liu,…

July 13, 2025

Critical Tokens Matter: Token-Level Contrastive Estimation Enhances LLM’s Reasoning Capabilityby Zicheng Lin, Tian Liang, Jiahao…