Language model – Page 96 – GrooveSquid.com

July 13, 2025

RecurrentGemma: Moving Past Transformers for Efficient Open Language Modelsby Aleksandar Botev, Soham De, Samuel L…

July 13, 2025

MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategiesby Shengding Hu, Yuge…

July 13, 2025

Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Lawsby Zeyuan Allen-Zhu, Yuanzhi LiFirst submitted…

July 13, 2025

Plug and Play with Prompts: A Prompt Tuning Approach for Controlling Text Generationby Rohan Deepak…

July 13, 2025

What Happens When Small Is Made Smaller? Exploring the Impact of Compression on Small Data…

July 13, 2025

Investigating Regularization of Self-Play Language Modelsby Reda Alami, Abdalgader Abubaker, Mastane Achab, Mohamed El Amine…

July 13, 2025

Do Sentence Transformers Learn Quasi-Geospatial Concepts from General Text?by Ilya Ilyankou, Aldo Lipani, Stefano Cavazzi,…

July 13, 2025

Advancing LLM Reasoning Generalists with Preference Treesby Lifan Yuan, Ganqu Cui, Hanbin Wang, Ning Ding,…

July 13, 2025

Asymptotics of Language Model Alignmentby Joy Qiping Yang, Salman Salamatian, Ziteng Sun, Ananda Theertha Suresh,…

July 13, 2025

Extensive Self-Contrast Enables Feedback-Free Language Model Alignmentby Xiao Liu, Xixuan Song, Yuxiao Dong, Jie TangFirst…