Inference – Page 123 – GrooveSquid.com

July 13, 2025

ReLU’s Revival: On the Entropic Overload in Normalization-Free Large Language Modelsby Nandan Kumar Jha, Brandon…

July 13, 2025

MoIN: Mixture of Introvert Experts to Upcycle an LLMby Ajinkya Tejankar, KL Navaneet, Ujjawal Panchal,…

July 13, 2025

FlatQuant: Flatness Matters for LLM Quantizationby Yuxuan Sun, Ruikang Liu, Haoli Bai, Han Bao, Kang…

July 13, 2025

Skipping Computations in Multimodal LLMsby Mustafa Shukor, Matthieu CordFirst submitted to arxiv on: 12 Oct…

July 13, 2025

VERITAS-NLI : Validation and Extraction of Reliable Information Through Automated Scraping and Natural Language Inferenceby…

July 13, 2025

Inference and Verbalization Functions During In-Context Learningby Junyi Tao, Xiaoyin Chen, Nelson F. LiuFirst submitted…

July 13, 2025

On Divergence Measures for Training GFlowNetsby Tiago da Silva, Eliezer de Souza da Silva, Diego…

July 13, 2025

Mamba4Cast: Efficient Zero-Shot Time Series Forecasting with State Space Modelsby Sathya Kamesh Bhethanabhotla, Omar Swelam,…

July 13, 2025

Nudging: Inference-time Alignment via Model Collaborationby Yu Fei, Yasaman Razeghi, Sameer SinghFirst submitted to arxiv…

July 13, 2025

Alignment Between the Decision-Making Logic of LLMs and Human Cognition: A Case Study on Legal…