Knowledge distillation – Page 5

July 13, 2025

Adaptive Explicit Knowledge Transfer for Knowledge Distillationby Hyungkeun Park, Jong-Seok LeeFirst submitted to arxiv on:…

July 13, 2025

Smaller, Weaker, Yet Better: Training LLM Reasoners via Compute-Optimal Samplingby Hritik Bansal, Arian Hosseini, Rishabh…

July 13, 2025

Interactive DualChecker for Mitigating Hallucinations in Distilling Large Language Modelsby Meiyun Wang, Masahiro Suzuki, Hiroki…

July 13, 2025

SAM-COD: SAM-guided Unified Framework for Weakly-Supervised Camouflaged Object Detectionby Huafeng Chen, Pengxu Wei, Guangqian Guo,…

July 13, 2025

MedMAP: Promoting Incomplete Multi-modal Brain Tumor Segmentation with Alignmentby Tianyi Liu, Zhaorui Tan, Muyin Chen,…

July 13, 2025

VizECGNet: Visual ECG Image Network for Cardiovascular Diseases Classification with Multi-Modal Training and Knowledge Distillationby…

July 13, 2025

Gemma 2: Improving Open Language Models at a Practical Sizeby Gemma Team, Morgane Riviere, Shreya…

July 13, 2025

Lifelong Person Searchby Jae-Won Yang, Seungbin Hong, Jae-Young SimFirst submitted to arxiv on: 31 Jul…

July 13, 2025

Pruning Large Language Models with Semi-Structural Adaptive Sparse Trainingby Weiyu Huang, Yuezhou Hu, Guohao Jian,…

July 13, 2025

Mixture of Modular Experts: Distilling Knowledge from a Multilingual Teacher into Specialized Modular Language Modelsby…