Token – Page 55 – GrooveSquid.com

July 13, 2025

OLMoE: Open Mixture-of-Experts Language Modelsby Niklas Muennighoff, Luca Soldaini, Dirk Groeneveld, Kyle Lo, Jacob Morrison,…

July 13, 2025

Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruningby Soumajyoti Sarkar, Leonard…

July 13, 2025

Prompt Compression with Context-Aware Sentence Encoding for Fast and Improved LLM Inferenceby Barys Liskavets, Maxim…

July 13, 2025

Self-Supervised Vision Transformers for Writer Retrievalby Tim Raven, Arthur Matei, Gernot A. FinkFirst submitted to…

July 13, 2025

Implicit Geometry of Next-token Prediction: From Language Sparsity Patterns to Model Representationsby Yize Zhao, Tina…

July 13, 2025

Boosting Lossless Speculative Decoding via Feature Sampling and Partial Alignment Distillationby Lujun Gui, Bin Xiao,…

July 13, 2025

Generative Verifiers: Reward Modeling as Next-Token Predictionby Lunjun Zhang, Arian Hosseini, Hritik Bansal, Mehran Kazemi,…

July 13, 2025

Advancing Adversarial Suffix Transfer Learning on Aligned Large Language Modelsby Hongfu Liu, Yuxi Xie, Ye…

July 13, 2025

LLMs as Zero-shot Graph Learners: Alignment of GNN Representations with LLM Token Embeddingsby Duo Wang,…

July 13, 2025

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentationby Trung Dinh Quoc Dang, Huy Hoang Nguyen,…