Token – Page 72 – GrooveSquid.com

July 13, 2025

Token-Efficient Leverage Learning in Large Language Modelsby Yuanhao Zeng, Min Wang, Yihang Wang, Yingxia ShaoFirst…

July 13, 2025

A General and Efficient Training for Transformer via Token Expansionby Wenxuan Huang, Yunhang Shen, Jiao…

July 13, 2025

On Large Language Models’ Hallucination with Regard to Known Factsby Che Jiang, Biqing Qi, Xiangyu…

July 13, 2025

Cost-Efficient Large Language Model Serving for Multi-turn Conversations with CachedAttentionby Bin Gao, Zhuomin He, Puru…

July 13, 2025

MambaMixer: Efficient Selective State Space Models with Dual Token and Channel Selectionby Ali Behrouz, Michele…

July 13, 2025

Non-Linear Inference Time Intervention: Improving LLM Truthfulnessby Jakub Hoscilowicz, Adam Wiacek, Jan Chojnacki, Adam Cieslak,…

July 13, 2025

Heracles: A Hybrid SSM-Transformer Model for High-Resolution Image and Time-Series Analysisby Badri N. Patro, Suhas…

July 13, 2025

Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokensby S M Jishanul…

July 13, 2025

VCR-Graphormer: A Mini-batch Graph Transformer via Virtual Connectionsby Dongqi Fu, Zhigang Hua, Yan Xie, Jin…

July 13, 2025

Lexicon-Level Contrastive Visual-Grounding Improves Language Modelingby Chengxu Zhuang, Evelina Fedorenko, Jacob AndreasFirst submitted to arxiv…