Language model – Page 61 – GrooveSquid.com

July 13, 2025

A Post-Training Enhanced Optimization Approach for Small Language Modelsby Keke ZhaiFirst submitted to arxiv on:…

July 13, 2025

Controlling for Unobserved Confounding with Large Language Model Classification of Patient Smoking Statusby Samuel Lee,…

July 13, 2025

TeleOracle: Fine-Tuned Retrieval-Augmented Generation with Long-Context Support for Networkby Nouf Alabbasi, Omar Erak, Omar Alhussein,…

July 13, 2025

Graph-based Confidence Calibration for Large Language Modelsby Yukun Li, Sijia Wang, Lifu Huang, Li-Ping LiuFirst…

July 13, 2025

Regress, Don’t Guess – A Regression-like Loss on Number Tokens for Language Modelsby Jonas Zausinger,…

July 13, 2025

Interacting Large Language Model Agents. Interpretable Models and Social Learningby Adit Jain, Vikram KrishnamurthyFirst submitted…

July 13, 2025

AttackQA: Development and Adoption of a Dataset for Assisting Cybersecurity Operations using Fine-tuned and Open-Source…

July 13, 2025

Normalization Layer Per-Example Gradients are Sufficient to Predict Gradient Noise Scale in Transformersby Gavia Gray,…

July 13, 2025

LLaMo: Large Language Model-based Molecular Graph Assistantby Jinyoung Park, Minseong Bae, Dohwan Ko, Hyunwoo J.…

July 13, 2025

MESS+: Energy-Optimal Inferencing in Language Model Zoos with Service Level Guaranteesby Ryan Zhang, Herbert Woisetschläger,…