Mixture of experts – Page 8

July 13, 2025

Imitation Learning from Observations: An Autoregressive Mixture of Experts Approachby Renzi Wang, Flavia Sofia Acerbo,…

July 13, 2025

PERFT: Parameter-Efficient Routed Fine-Tuning for Mixture-of-Expert Modelby Yilun Liu, Yunpu Ma, Shuo Chen, Zifeng Ding,…

July 13, 2025

Adaptive Conditional Expert Selection Network for Multi-domain Recommendationby Kuiyao Dong, Xingyu Lou, Feng Liu, Ruian…

July 13, 2025

WDMoE: Wireless Distributed Mixture of Experts for Large Language Modelsby Nan Xue, Yaping Sun, Zhiyong…

July 13, 2025

NeKo: Toward Post Recognition Generative Correction Large Language Models with Task-Oriented Expertsby Yen-Ting Lin, Chao-Han…

July 13, 2025

FedMoE-DA: Federated Mixture of Experts via Domain Aware Fine-grained Aggregationby Ziwei Zhan, Wenkuan Zhao, Yuanqing…

July 13, 2025

HOBBIT: A Mixed Precision Expert Offloading System for Fast MoE Inferenceby Peng Tang, Jiacheng Liu,…

July 13, 2025

LIBMoE: A Library for comprehensive benchmarking Mixture of Experts in Large Language Modelsby Nam V.…

July 13, 2025

MoNTA: Accelerating Mixture-of-Experts Training with Network-Traffc-Aware Parallel Optimizationby Jingming Guo, Yan Liu, Yu Meng, Zhiwei…

July 13, 2025

Efficient and Effective Weight-Ensembling Mixture of Experts for Multi-Task Model Mergingby Li Shen, Anke Tang,…