GPT – Page 108 – GrooveSquid.com

July 13, 2025

Sparse Attention Decomposition Applied to Circuit Tracingby Gabriel Franco, Mark CrovellaFirst submitted to arxiv on:…

July 13, 2025

Evaluating the fairness of task-adaptive pretraining on unlabeled test data before few-shot text classificationby Kush…

July 13, 2025

On The Planning Abilities of OpenAI’s o1 Models: Feasibility, Optimality, and Generalizabilityby Kevin Wang, Junbo…

July 13, 2025

Can Models Learn Skill Composition from Examples?by Haoyu Zhao, Simran Kaur, Dingli Yu, Anirudh Goyal,…

July 13, 2025

HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversationsby Ziyu Wang, Hao Li, Di…

July 13, 2025

Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillationby Graison Jos ThomasFirst submitted to…

July 13, 2025

Cottention: Linear Transformers With Cosine Attentionby Gabriel Mongaras, Trevor Dohm, Eric C. LarsonFirst submitted to…

July 13, 2025

Experimental Evaluation of Machine Learning Models for Goal-oriented Customer Service Chatbot with Pipeline Architectureby Nurul…

July 13, 2025

MMMT-IF: A Challenging Multimodal Multi-Turn Instruction Following Benchmarkby Elliot L. Epstein, Kaisheng Yao, Jing Li,…

July 13, 2025

Severity Prediction in Mental Health: LLM-based Creation, Analysis, Evaluation of a Novel Multilingual Datasetby Konstantinos…