Fine tuning – Page 88 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Gradient Weight-normalized Low-rank Projection For Efficient Llm Training, by Jia-hong Huang et al.

Gradient Weight-normalized Low-rank Projection for Efficient LLM Trainingby Jia-Hong Huang, Yixian Shen, Hongyi Zhu, Stevan…

July 13, 2025

Summary of Assessing Pre-trained Models For Transfer Learning Through Distribution Of Spectral Components, by Tengxue Zhang et al.

Assessing Pre-Trained Models for Transfer Learning Through Distribution of Spectral Componentsby Tengxue Zhang, Yang Shu,…

July 13, 2025

Summary of Optimistic Critic Reconstruction and Constrained Fine-tuning For General Offline-to-online Rl, by Qin-wen Luo et al.

Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RLby Qin-Wen Luo, Ming-Kun Xie, Ye-Wen…

July 13, 2025

Summary of Huatuogpt-o1, Towards Medical Complex Reasoning with Llms, by Junying Chen et al.

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMsby Junying Chen, Zhenyang Cai, Ke Ji, Xidong Wang,…

July 13, 2025

Summary of Optimizing Large Language Models with An Enhanced Lora Fine-tuning Algorithm For Efficiency and Robustness in Nlp Tasks, by Jiacheng Hu et al.

Optimizing Large Language Models with an Enhanced LoRA Fine-Tuning Algorithm for Efficiency and Robustness in…

July 13, 2025

Summary of Torque-aware Momentum, by Pranshu Malviya et al.

Torque-Aware Momentumby Pranshu Malviya, Goncalo Mordido, Aristide Baratin, Reza Babanezhad Harikandeh, Gintare Karolina Dziugaite, Razvan…

July 13, 2025

Summary of Agreemate: Teaching Llms to Haggle, by Ainesh Chatterjee et al.

AgreeMate: Teaching LLMs to Haggleby Ainesh Chatterjee, Samuel Miller, Nithin ParepallyFirst submitted to arxiv on:…

July 13, 2025

Summary of Famebias: Embedding Manipulation Bias Attack in Text-to-image Models, by Jaechul Roh et al.

FameBias: Embedding Manipulation Bias Attack in Text-to-Image Modelsby Jaechul Roh, Andrew Yuan, Jinsong MaoFirst submitted…

July 13, 2025

Summary of Mmfactory: a Universal Solution Search Engine For Vision-language Tasks, by Wan-cyuan Fan et al.

MMFactory: A Universal Solution Search Engine for Vision-Language Tasksby Wan-Cyuan Fan, Tanzila Rahman, Leonid SigalFirst…

July 13, 2025

Summary of Stochastic Control For Fine-tuning Diffusion Models: Optimality, Regularity, and Convergence, by Yinbin Han et al.

Stochastic Control for Fine-tuning Diffusion Models: Optimality, Regularity, and Convergenceby Yinbin Han, Meisam Razaviyayn, Renyuan…