Mixture of experts – Page 6

July 13, 2025

ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routingby Ziteng Wang, Jun Zhu, Jianfei ChenFirst submitted to…

July 13, 2025

A Survey on Inference Optimization Techniques for Mixture of Experts Modelsby Jiacheng Liu, Peng Tang,…

July 13, 2025

Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architectureby Jingze Shi, Bingheng…

July 13, 2025

Towards Adversarial Robustness of Model-Level Mixture-of-Experts Architectures for Semantic Segmentationby Svetlana Pavlitska, Enrico Eisen, J.…

July 13, 2025

Llama 3 Meets MoE: Efficient Upcyclingby Aditya Vavre, Ethan He, Dennis Liu, Zijie Yan, June…

July 13, 2025

Mixture of Experts Meets Decoupled Message Passing: Towards General and Adaptive Node Classificationby Xuanze Chen,…

July 13, 2025

MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systemsby Yao Fu, Yinsicheng Jiang, Yeqi…

July 13, 2025

SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Expertsby Gengze Zhou, Yicong Hong,…

July 13, 2025

Convolutional Neural Networks and Mixture of Experts for Intrusion Detection in 5G Networks and beyondby…

July 13, 2025

Yi-Lightning Technical Reportby Alan Wake, Bei Chen, C.X. Lv, Chao Li, Chengen Huang, Chenglin Cai,…