Fine tuning – Page 191 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Rlsf: Reinforcement Learning Via Symbolic Feedback, by Piyush Jha et al.

RLSF: Reinforcement Learning via Symbolic Feedbackby Piyush Jha, Prithwish Jana, Pranavkrishna Suresh, Arnav Arora, Vijay…

July 13, 2025

Summary of Loqt: Low-rank Adapters For Quantized Pretraining, by Sebastian Loeschcke et al.

LoQT: Low-Rank Adapters for Quantized Pretrainingby Sebastian Loeschcke, Mads Toftrup, Michael J. Kastoryano, Serge Belongie,…

July 13, 2025

Summary of Multi-reference Preference Optimization For Large Language Models, by Hung Le et al.

Multi-Reference Preference Optimization for Large Language Modelsby Hung Le, Quan Tran, Dung Nguyen, Kien Do,…

July 13, 2025

Summary of Kg-fit: Knowledge Graph Fine-tuning Upon Open-world Knowledge, by Pengcheng Jiang et al.

KG-FIT: Knowledge Graph Fine-Tuning Upon Open-World Knowledgeby Pengcheng Jiang, Lang Cao, Cao Xiao, Parminder Bhatia,…

July 13, 2025

Summary of Provably Mitigating Overoptimization in Rlhf: Your Sft Loss Is Implicitly An Adversarial Regularizer, by Zhihan Liu et al.

Provably Mitigating Overoptimization in RLHF: Your SFT Loss is Implicitly an Adversarial Regularizerby Zhihan Liu,…

July 13, 2025

Summary of Mindstar: Enhancing Math Reasoning in Pre-trained Llms at Inference Time, by Jikun Kang et al.

MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Timeby Jikun Kang, Xin Zhe Li,…

July 13, 2025

Summary of A Second-order Perspective on Model Compositionality and Incremental Learning, by Angelo Porrello and Lorenzo Bonicelli and Pietro Buzzega and Monica Millunzi and Simone Calderara and Rita Cucchiara

A Second-Order Perspective on Model Compositionality and Incremental Learningby Angelo Porrello, Lorenzo Bonicelli, Pietro Buzzega,…

July 13, 2025

Summary of A Transfer Learning Framework For Weak-to-strong Generalization, by Seamus Somerstep et al.

A transfer learning framework for weak-to-strong generalizationby Seamus Somerstep, Felipe Maia Polo, Moulinath Banerjee, Ya'acov…

July 13, 2025

Summary of Feature Protection For Out-of-distribution Generalization, by Lu Tan et al.

Feature Protection For Out-of-distribution Generalizationby Lu Tan, Huei Zhou, Yinxiang Huang, Zeming Zheng, Yujiu YangFirst…

July 13, 2025

Summary of Spp: Sparsity-preserved Parameter-efficient Fine-tuning For Large Language Models, by Xudong Lu et al.

SPP: Sparsity-Preserved Parameter-Efficient Fine-Tuning for Large Language Modelsby Xudong Lu, Aojun Zhou, Yuhui Xu, Renrui…