Inference – Page 22 – GrooveSquid.com

July 13, 2025

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Modelsby Yifei Liu, Jicheng Wen, Yang…

July 13, 2025

LLaMa-SciQ: An Educational Chatbot for Answering Science MCQby Marc-Antoine Allard, Matin Ansaripour, Maria Yuffa, Paul…

July 13, 2025

AXCEL: Automated eXplainable Consistency Evaluation using LLMsby P Aditya Sreekar, Sahil Verma, Suransh Chopra, Sarik…

July 13, 2025

Dynamic-Width Speculative Beam Decoding for Efficient LLM Inferenceby Zongyue Qin, Zifan He, Neha Prakriya, Jason…

July 13, 2025

Leveraging Unsupervised Learning for Cost-Effective Visual Anomaly Detectionby Yunbo Long, Zhengyang Ling, Sam Brook, Duncan…

July 13, 2025

Parse Trees Guided LLM Prompt Compressionby Wenhao Mao, Chengbin Hou, Tianyu Zhang, Xinyu Lin, Ke…

July 13, 2025

From Text to Treatment Effects: A Meta-Learning Approach to Handling Text-Based Confoundingby Henri Arno, Paloma…

July 13, 2025

FACET: Fast and Accurate Event-Based Eye Tracking Using Ellipse Modeling for Extended Realityby Junyuan Ding,…

July 13, 2025

Benchmarking Edge AI Platforms for High-Performance ML Inferenceby Rakshith Jayanth, Neelesh Gupta, Viktor PrasannaFirst submitted…

July 13, 2025

A-VL: Adaptive Attention for Large Vision-Language Modelsby Junyang Zhang, Mu Yuan, Ruiguang Zhong, Puhan Luo,…