Lora – Page 17 – GrooveSquid.com

July 13, 2025

MIRA: A Method of Federated MultI-Task Learning for LaRge LAnguage Modelsby Ahmed Elbakary, Chaouki Ben…

July 13, 2025

Collaboratively adding new knowledge to an LLMby Rhui Dih Lee, Laura WynterFirst submitted to arxiv…

July 13, 2025

Implicit Regularization of Sharpness-Aware Minimization for Scale-Invariant Problemsby Bingcong Li, Liang Zhang, Niao HeFirst submitted…

July 13, 2025

QuAILoRA: Quantization-Aware Initialization for LoRAby Neal Lawton, Aishwarya Padmakumar, Judith Gaspers, Jack FitzGerald, Anoop Kumar,…

July 13, 2025

FiTv2: Scalable and Improved Flexible Vision Transformer for Diffusion Modelby ZiDong Wang, Zeyu Lu, Di…

July 13, 2025

MoR: Mixture of Ranks for Low-Rank Adaptation Tuningby Chuanyu Tang, Yilong Chen, Zhenyu Zhang, Junyuan…

July 13, 2025

LoRA Soups: Merging LoRAs for Practical Skill Composition Tasksby Akshara Prabhakar, Yuanzhi Li, Karthik Narasimhan,…

July 13, 2025

In-context KV-Cache Eviction for LLMs via Attention-Gateby Zihao Zeng, Bokai Lin, Tianqi Hou, Hao Zhang,…

July 13, 2025

LoKO: Low-Rank Kalman Optimizer for Online Fine-Tuning of Large Modelsby Hossein Abdi, Mingfei Sun, Andi…

July 13, 2025

AT-MoE: Adaptive Task-planning Mixture of Experts via LoRA Approachby Xurui Li, Juanjuan YaoFirst submitted to…