LLaMA – Page 42 – GrooveSquid.com

July 13, 2025

MoDeGPT: Modular Decomposition for Large Language Model Compressionby Chi-Heng Lin, Shangqian Gao, James Seale Smith,…

July 13, 2025

A Mean Field Ansatz for Zero-Shot Weight Transferby Xingyuan Chen, Wenwei Kuang, Lei Deng, Wei…

July 13, 2025

JPEG-LM: LLMs as Image Generators with Canonical Codec Representationsby Xiaochuang Han, Marjan Ghazvininejad, Pang Wei…

July 13, 2025

Benchmarking the Capabilities of Large Language Models in Transportation System Engineering: Accuracy, Consistency, and Reasoning…

July 13, 2025

Anchored Preference Optimization and Contrastive Revisions: Addressing Underspecification in Alignmentby Karel D'Oosterlinck, Winnie Xu, Chris…

July 13, 2025

Eigen Attention: Attention in Low-Rank Space for KV Cache Compressionby Utkarsh Saxena, Gobinda Saha, Sakshi…

July 13, 2025

BA-LoRA: Bias-Alleviating Low-Rank Adaptation to Mitigate Catastrophic Inheritance in Large Language Modelsby Yupeng Chang, Yi…

July 13, 2025

Efficacy of Large Language Models in Systematic Reviewsby Aaditya Shah, Shridhar Mehendale, Siddha KanthiFirst submitted…

July 13, 2025

Risks, Causes, and Mitigations of Widespread Deployments of Large Language Models (LLMs): A Surveyby Md…

July 13, 2025

Tree Attention: Topology-aware Decoding for Long-Context Attention on GPU clustersby Vasudev Shyam, Jonathan Pilault, Emily…