Artificial intelligence – Page 3313

July 13, 2025

Jamba: A Hybrid Transformer-Mamba Language Modelby Opher Lieber, Barak Lenz, Hofit Bata, Gal Cohen, Jhonathan…

July 13, 2025

MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selectionby Ali Behrouz, Michele…

July 13, 2025

Towards a Robust Retrieval-Based Summarization Systemby Shengjie Liu, Jing Wu, Jingyuan Bao, Wenyi Wang, Naira…

July 13, 2025

Regression with Multi-Expert Deferralby Anqi Mao, Mehryar Mohri, Yutao ZhongFirst submitted to arxiv on: 28…

July 13, 2025

Client-supervised Federated Learning: Towards One-model-for-all Personalizationby Peng Yan, Guodong LongFirst submitted to arxiv on: 28…

July 13, 2025

Tensor Network-Constrained Kernel Machines as Gaussian Processesby Frederiek Wesel, Kim BatselierFirst submitted to arxiv on:…

July 13, 2025

SineNet: Learning Temporal Dynamics in Time-Dependent Partial Differential Equationsby Xuan Zhang, Jacob Helwig, Yuchao Lin,…

July 13, 2025

CDIMC-net: Cognitive Deep Incomplete Multi-view Clustering Networkby Jie Wen, Zheng Zhang, Yong Xu, Bob Zhang,…

July 13, 2025

Interpreting Key Mechanisms of Factual Recall in Transformer-Based Language Modelsby Ang Lv, Yuhan Chen, Kaiyi…

July 13, 2025

Maximum Likelihood Estimation on Stochastic Blockmodels for Directed Graph Clusteringby Mihai Cucuringu, Xiaowen Dong, Ning…