Mixture of experts – Page 13 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Uniadapt: a Universal Adapter For Knowledge Calibration, by Tai D. Nguyen et al.

UniAdapt: A Universal Adapter for Knowledge Calibrationby Tai D. Nguyen, Long H. Pham, Jun SunFirst…

July 13, 2025

Summary of Mm1.5: Methods, Analysis & Insights From Multimodal Llm Fine-tuning, by Haotian Zhang et al.

MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuningby Haotian Zhang, Mingfei Gao, Zhe Gan,…

July 13, 2025

Summary of Time-moe: Billion-scale Time Series Foundation Models with Mixture Of Experts, by Xiaoming Shi et al.

Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Expertsby Xiaoming Shi, Shiyu Wang, Yuqi…

July 13, 2025

Summary of A Gated Residual Kolmogorov-arnold Networks For Mixtures Of Experts, by Hugo Inzirillo and Remi Genet

A Gated Residual Kolmogorov-Arnold Networks for Mixtures of Expertsby Hugo Inzirillo, Remi GenetFirst submitted to…

July 13, 2025

Summary of On-device Collaborative Language Modeling Via a Mixture Of Generalists and Specialists, by Dongyang Fan et al.

On-Device Collaborative Language Modeling via a Mixture of Generalists and Specialistsby Dongyang Fan, Bettina Messmer,…

July 13, 2025

Summary of Mixture Of Diverse Size Experts, by Manxi Sun et al.

Mixture of Diverse Size Expertsby Manxi Sun, Wei Liu, Jian Luan, Pengzhi Gao, Bin WangFirst…

July 13, 2025

Summary of Grin: Gradient-informed Moe, by Liyuan Liu et al.

GRIN: GRadient-INformed MoEby Liyuan Liu, Young Jin Kim, Shuohang Wang, Chen Liang, Yelong Shen, Hao…

July 13, 2025

Summary of Lola — An Open-source Massively Multilingual Large Language Model, by Nikit Srivastava et al.

LOLA – An Open-Source Massively Multilingual Large Language Modelby Nikit Srivastava, Denis Kuchelev, Tatiana Moteu…

July 13, 2025

Summary of Da-moe: Towards Dynamic Expert Allocation For Mixture-of-experts Models, by Maryam Akhavan Aghdam et al.

DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Modelsby Maryam Akhavan Aghdam, Hongpeng Jin, Yanzhao WuFirst…