Sigmoid – Page 2 – GrooveSquid.com

July 13, 2025

When Attention Sink Emerges in Language Models: An Empirical Viewby Xiangming Gu, Tianyu Pang, Chao…

July 13, 2025

Towards Calibrated Losses for Adversarial Robust Reject Option Classificationby Vrund Shah, Tejas Chaudhari, Naresh ManwaniFirst…

July 13, 2025

Nonuniform random feature models using derivative informationby Konstantin Pieper, Zezhong Zhang, Guannan ZhangFirst submitted to…

July 13, 2025

Is uniform expressivity too restrictive? Towards efficient expressivity of graph neural networksby Sammy Khalife, Josué…

July 13, 2025

Theory, Analysis, and Best Practices for Sigmoid Self-Attentionby Jason Ramapuram, Federico Danieli, Eeshan Dhekane, Floris…

July 13, 2025

On Expressive Power of Quantized Neural Networks under Fixed-Point Arithmeticby Geonho Hwang, Yeachan Park, Sejun…

July 13, 2025

Artificial Neural Network and Deep Learning: Fundamentals and Theoryby M. M. HammadFirst submitted to arxiv…

July 13, 2025

Improving Nonlinear Projection Heads using Pretrained Autoencoder Embeddingsby Andreas Schliebitz, Heiko Tapken, Martin AtzmuellerFirst submitted…

July 13, 2025

Adaptive Friction in Deep Learning: Enhancing Optimizers with Sigmoid and Tanh Functionby Hongye Zheng, Bingxing…

July 13, 2025

Achieving the Tightest Relaxation of Sigmoids for Formal Verificationby Samuel Chevalier, Duncan Starkenburg, Krishnamurthy DvijothamFirst…