LLaMA – Page 47 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Shadowllm: Predictor-based Contextual Sparsity For Large Language Models, by Yash Akhauri et al.

ShadowLLM: Predictor-based Contextual Sparsity for Large Language Modelsby Yash Akhauri, Ahmed F AbouElhamayed, Jordan Dotzel,…

July 13, 2025

Summary of Autodetect: Towards a Unified Framework For Automated Weakness Detection in Large Language Models, by Jiale Cheng et al.

AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Modelsby Jiale Cheng,…

July 13, 2025

Summary of What Matters in Transformers? Not All Attention Is Needed, by Shwai He et al.

What Matters in Transformers? Not All Attention is Neededby Shwai He, Guoheng Sun, Zheyu Shen,…

July 13, 2025

Summary of Lamsum: Amplifying Voices Against Harassment Through Llm Guided Extractive Summarization Of User Incident Reports, by Garima Chhikara et al.

LaMSUM: Amplifying Voices Against Harassment through LLM Guided Extractive Summarization of User Incident Reportsby Garima…

July 13, 2025

Summary of Steering Without Side Effects: Improving Post-deployment Control Of Language Models, by Asa Cooper Stickland et al.

Steering Without Side Effects: Improving Post-Deployment Control of Language Modelsby Asa Cooper Stickland, Alexander Lyzhov,…

July 13, 2025

Summary of Optimised Grouped-query Attention Mechanism For Transformers, by Yuang Chen et al.

Optimised Grouped-Query Attention Mechanism for Transformersby Yuang Chen, Cheng Zhang, Xitong Gao, Robert D. Mullins,…

July 13, 2025

Summary of Domain Adaptation Of Llama3-70b-instruct Through Continual Pre-training and Model Merging: a Comprehensive Evaluation, by Shamane Siriwardhana et al.

Domain Adaptation of Llama3-70B-Instruct through Continual Pre-Training and Model Merging: A Comprehensive Evaluationby Shamane Siriwardhana,…

July 13, 2025

Summary of Understanding Finetuning For Factual Knowledge Extraction, by Gaurav Ghosal et al.

Understanding Finetuning for Factual Knowledge Extractionby Gaurav Ghosal, Tatsunori Hashimoto, Aditi RaghunathanFirst submitted to arxiv…

July 13, 2025

Summary of Can Low-rank Knowledge Distillation in Llms Be Useful For Microelectronic Reasoning?, by Nirjhor Rouf et al.

Can Low-Rank Knowledge Distillation in LLMs be Useful for Microelectronic Reasoning?by Nirjhor Rouf, Fin Amin,…

July 13, 2025

Summary of Moyu: a Theoretical Study on Massive Over-activation Yielded Uplifts in Llms, by Chi Ma et al.

MOYU: A Theoretical Study on Massive Over-activation Yielded Uplifts in LLMsby Chi Ma, Mincong Huang,…