Token – Page 78 – GrooveSquid.com

July 13, 2025

Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcementby Muning Wen, Junwei Liao, Cheng Deng, Jun…

July 13, 2025

Breaking Symmetry When Training Transformersby Chunsheng Zuo, Michael GuerzhoyFirst submitted to arxiv on: 6 Feb…

July 13, 2025

How do Transformers perform In-Context Autoregressive Learning?by Michael E. Sander, Raja Giryes, Taiji Suzuki, Mathieu…

July 13, 2025

Learning to Route Among Specialized Experts for Zero-Shot Generalizationby Mohammed Muqeeth, Haokun Liu, Yufan Liu,…

July 13, 2025

Improving Token-Based World Models with Parallel Observation Predictionby Lior Cohen, Kaixin Wang, Bingyi Kang, Shie…

July 13, 2025

On Provable Length and Compositional Generalizationby Kartik Ahuja, Amin MansouriFirst submitted to arxiv on: 7…

July 13, 2025

Neural Networks Learn Statistics of Increasing Complexityby Nora Belrose, Quintin Pope, Lucia Quirke, Alex Mallen,…

July 13, 2025

Provably learning a multi-head attention layerby Sitan Chen, Yuanzhi LiFirst submitted to arxiv on: 6…

July 13, 2025

Distinguishing the Knowable from the Unknowable with Language Modelsby Gustaf Ahdritz, Tian Qin, Nikhil Vyas,…

July 13, 2025

Sociolinguistically Informed Interpretability: A Case Study on Hinglish Emotion Classificationby Kushal Tatariya, Heather Lent, Johannes…