Fine tuning – Page 2 – GrooveSquid.com

July 13, 2025

DRT: Deep Reasoning Translation via Long Chain-of-Thoughtby Jiaan Wang, Fandong Meng, Yunlong Liang, Jie ZhouFirst…

July 13, 2025

On the Feasibility of Vision-Language Models for Time-Series Classificationby Vinay Prithyani, Mohsin Mohammed, Richa Gadgil,…

July 13, 2025

Boosting LLM via Learning from Data Iteratively and Selectivelyby Qi Jia, Siyu Ren, Ziheng Qin,…

July 13, 2025

Singular Value Scaling: Efficient Generative Model Compression via Pruned Weights Refinementby Hyeonjin Kim, Jaejun YooFirst…

July 13, 2025

Cannot or Should Not? Automatic Analysis of Refusal Composition in IFT/RLHF Datasets and Refusal Behavior…

July 13, 2025

GAS: Generative Auto-bidding with Post-training Searchby Yewen Li, Shuai Mao, Jingtong Gao, Nan Jiang, Yunjian…

July 13, 2025

Survey on Abstractive Text Summarization: Dataset, Models, and Metricsby Gospel Ozioma Nnadi, Flavio BertiniFirst submitted…

July 13, 2025

Online Learning from Strategic Human Feedback in LLM Fine-Tuningby Shugang Hao, Lingjie DuanFirst submitted to…

July 13, 2025

OpenRFT: Adapting Reasoning Foundation Model for Domain-specific Tasks with Reinforcement Fine-Tuningby Yuxiang Zhang, Yuqi Yang,…

July 13, 2025

System-2 Mathematical Reasoning via Enriched Instruction Tuningby Huanqia Cai, Yijun Yang, Zhifeng LiFirst submitted to…