LLaMA – Page 45 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Optimized Multi-token Joint Decoding with Auxiliary Model For Llm Inference, by Zongyue Qin et al.

Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inferenceby Zongyue Qin, Ziniu Hu, Zifan…

July 13, 2025

Summary of Q-galore: Quantized Galore with Int4 Projection and Layer-adaptive Low-rank Gradients, by Zhenyu Zhang et al.

Q-GaLore: Quantized GaLore with INT4 Projection and Layer-Adaptive Low-Rank Gradientsby Zhenyu Zhang, Ajay Jaiswal, Lu…

July 13, 2025

Summary of Rolora: Fine-tuning Rotated Outlier-free Llms For Effective Weight-activation Quantization, by Xijie Huang et al.

RoLoRA: Fine-tuning Rotated Outlier-free LLMs for Effective Weight-Activation Quantizationby Xijie Huang, Zechun Liu, Shih-Yang Liu,…

July 13, 2025

Summary of Convnlp: Image-based Ai Text Detection, by Suriya Prakash Jambunathan et al.

ConvNLP: Image-based AI Text Detectionby Suriya Prakash Jambunathan, Ashwath Shankarnarayan, Parijat DubeFirst submitted to arxiv…

July 13, 2025

Summary of An Empirical Comparison Of Vocabulary Expansion and Initialization Approaches For Language Models, by Nandini Mundra et al.

An Empirical Comparison of Vocabulary Expansion and Initialization Approaches for Language Modelsby Nandini Mundra, Aditya…

July 13, 2025

Summary of Q-adapter: Customizing Pre-trained Llms to New Preferences with Forgetting Mitigation, by Yi-chen Li et al.

Q-Adapter: Customizing Pre-trained LLMs to New Preferences with Forgetting Mitigationby Yi-Chen Li, Fuxiang Zhang, Wenjie…

July 13, 2025

Summary of Self-evaluation As a Defense Against Adversarial Attacks on Llms, by Hannah Brown et al.

Self-Evaluation as a Defense Against Adversarial Attacks on LLMsby Hannah Brown, Leon Lin, Kenji Kawaguchi,…

July 13, 2025

Summary of Rlhf Can Speak Many Languages: Unlocking Multilingual Preference Optimization For Llms, by John Dang et al.

RLHF Can Speak Many Languages: Unlocking Multilingual Preference Optimization for LLMsby John Dang, Arash Ahmadian,…

July 13, 2025

Summary of Enhancing Stability For Large Language Models Training in Constrained Bandwidth Networks, by Yun Dai et al.

Enhancing Stability for Large Language Models Training in Constrained Bandwidth Networksby Yun Dai, Tejas Dharamsi,…

July 13, 2025

Summary of Badllama 3: Removing Safety Finetuning From Llama 3 in Minutes, by Dmitrii Volkov

Badllama 3: removing safety finetuning from Llama 3 in minutesby Dmitrii VolkovFirst submitted to arxiv…