Fine tuning – Page 109 – GrooveSquid.com

July 13, 2025

A Post-Training Enhanced Optimization Approach for Small Language Modelsby Keke ZhaiFirst submitted to arxiv on:…

July 13, 2025

A Mamba Foundation Model for Time Series Forecastingby Haoyu Ma, Yushu Chen, Wenlai Zhao, Jinzhe…

July 13, 2025

ATM: Improving Model Merging by Alternating Tuning and Mergingby Luca Zhou, Daniele Solombrino, Donato Crisostomi,…

July 13, 2025

Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignmentby Jason Vega, Junsheng Huang,…

July 13, 2025

Specialized Foundation Models Struggle to Beat Supervised Baselinesby Zongzhe Xu, Ritvik Gupta, Wenduo Cheng, Alexander…

July 13, 2025

On the Loss of Context-awareness in General Instruction Fine-tuningby Yihan Wang, Andrew Bai, Nanyun Peng,…

July 13, 2025

MM-Embed: Universal Multimodal Retrieval with Multimodal LLMsby Sheng-Chieh Lin, Chankyu Lee, Mohammad Shoeybi, Jimmy Lin,…

July 13, 2025

TeleOracle: Fine-Tuned Retrieval-Augmented Generation with Long-Context Support for Networkby Nouf Alabbasi, Omar Erak, Omar Alhussein,…

July 13, 2025

Improving Steering Vectors by Targeting Sparse Autoencoder Featuresby Sviatoslav Chalnev, Matthew Siu, Arthur ConmyFirst submitted…

July 13, 2025

Provably Transformers Harness Multi-Concept Word Semantics for Efficient In-Context Learningby Dake Bu, Wei Huang, Andi…