Token – Page 51 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Scaling Optimal Lr Across Token Horizons, by Johan Bjorck et al.

Scaling Optimal LR Across Token Horizonsby Johan Bjorck, Alon Benhaim, Vishrav Chaudhary, Furu Wei, Xia…

July 13, 2025

Summary of Calibrating Language Models with Adaptive Temperature Scaling, by Johnathan Xie et al.

Calibrating Language Models with Adaptive Temperature Scalingby Johnathan Xie, Annie S. Chen, Yoonho Lee, Eric…

July 13, 2025

Summary of Exploring Token Pruning in Vision State Space Models, by Zheng Zhan et al.

Exploring Token Pruning in Vision State Space Modelsby Zheng Zhan, Zhenglun Kong, Yifan Gong, Yushu…

July 13, 2025

Summary of Review Of Digital Asset Development with Graph Neural Network Unlearning, by Zara Lisbon

Review of Digital Asset Development with Graph Neural Network Unlearningby Zara LisbonFirst submitted to arxiv…

July 13, 2025

Summary of On the Optimal Memorization Capacity Of Transformers, by Tokio Kajitsuka et al.

On the Optimal Memorization Capacity of Transformersby Tokio Kajitsuka, Issei SatoFirst submitted to arxiv on:…

July 13, 2025

Summary of Language Models As Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Models, by Hui-po Wang et al.

Language Models as Zero-shot Lossless Gradient Compressors: Towards General Neural Parameter Prior Modelsby Hui-Po Wang,…

July 13, 2025

Summary of Rmgpt: Rotating Machinery Generative Pretrained Model, by Yilin Wang et al.

RmGPT: Rotating Machinery Generative Pretrained Modelby Yilin Wang, Yifei Yu, Kong Sun, Peixuan Lei, Yuxuan…

July 13, 2025

Summary of Non-asymptotic Convergence Of Training Transformers For Next-token Prediction, by Ruiquan Huang et al.

Non-asymptotic Convergence of Training Transformers for Next-token Predictionby Ruiquan Huang, Yingbin Liang, Jing YangFirst submitted…

July 13, 2025

Summary of Counterfactual Token Generation in Large Language Models, by Ivi Chatzi et al.

Counterfactual Token Generation in Large Language Modelsby Ivi Chatzi, Nina Corvelo Benz, Eleni Straitouri, Stratis…

July 13, 2025

Summary of Characterizing Stable Regions in the Residual Stream Of Llms, by Jett Janiak et al.

Characterizing stable regions in the residual stream of LLMsby Jett Janiak, Jacek Karwowski, Chatrik Singh…