Instruction tuning – Page 15

July 13, 2025

UFT: Unifying Fine-Tuning of SFT and RLHF/DPO/UNA through a Generalized Implicit Reward Functionby Zhichao Wang,…

July 13, 2025

BongLLaMA: LLaMA for Bangla Languageby Abdullah Khan Zehady, Safi Al Mamun, Naymul Islam, Santu KarmakerFirst…

July 13, 2025

Layer by Layer: Uncovering Where Multi-Task Learning Happens in Instruction-Tuned Large Language Modelsby Zheng Zhao,…

July 13, 2025

Influential Language Data Selection via Gradient Trajectory Pursuitby Zhiwei Deng, Tao Li, Yang LiFirst submitted…

July 13, 2025

LLMOPT: Learning to Define and Solve General Optimization Problems from Scratchby Caigao Jiang, Xiang Shu,…

July 13, 2025

Data Quality Control in Federated Instruction-tuning of Large Language Modelsby Yaxin Du, Rui Ye, Fengting…

July 13, 2025

TSDS: Data Selection for Task-Specific Model Finetuningby Zifan Liu, Amin Karbasi, Theodoros RekatsinasFirst submitted to…

July 13, 2025

Federated Data-Efficient Instruction Tuning for Large Language Modelsby Zhen Qin, Zhaomin Wu, Bingsheng He, Shuiguang…

July 13, 2025

Large Continual Instruction Assistantby Jingyang Qiao, Zhizhong Zhang, Xin Tan, Yanyun Qu, Shouhong Ding, Yuan…

July 13, 2025

Context-Parametric Inversion: Why Instruction Finetuning May Not Actually Improve Context Relianceby Sachin Goyal, Christina Baek,…