Token – Page 54 – GrooveSquid.com

July 13, 2025

Token Turing Machines are Efficient Vision Modelsby Purvish Jajal, Nick John Eliopoulos, Benjamin Shiue-Hal Chou,…

July 13, 2025

Representation Tuningby Christopher M. AckermanFirst submitted to arxiv on: 11 Sep 2024CategoriesMain: Machine Learning (cs.LG)Secondary:…

July 13, 2025

Understanding Knowledge Drift in LLMs through Misinformationby Alina Fastowski, Gjergji KasneciFirst submitted to arxiv on:…

July 13, 2025

Alleviating Hallucinations in Large Language Models with Scepticism Modelingby Yetao Wu, Yihong Wang, Teng Chen,…

July 13, 2025

DA-MoE: Towards Dynamic Expert Allocation for Mixture-of-Experts Modelsby Maryam Akhavan Aghdam, Hongpeng Jin, Yanzhao WuFirst…

July 13, 2025

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generationby Yecheng Wu, Zhuoyang Zhang, Junyu…

July 13, 2025

Residual Stream Analysis with Multi-Layer SAEsby Tim Lawson, Lucy Farnik, Conor Houghton, Laurence AitchisonFirst submitted…

July 13, 2025

Preserving Empirical Probabilities in BERT for Small-sample Clinical Entity Recognitionby Abdul Rehman, Jian Jun Zhang,…

July 13, 2025

Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Samplingby Kaiwen Zheng,…

July 13, 2025

Deconfounded Causality-aware Parameter-Efficient Fine-Tuning for Problem-Solving Improvement of LLMsby Ruoyu Wang, Xiaoxuan Li, Lina YaoFirst…