Tokenizer – GrooveSquid.com

July 13, 2025

L3TC: Leveraging RWKV for Learned Lossless Low-Complexity Text Compressionby Junxuan Zhang, Zhengxue Cheng, Yan Zhao,…

July 13, 2025

SweetTok: Semantic-Aware Spatial-Temporal Tokenizer for Compact Video Discretizationby Zhentao Tan, Ben Xue, Jian Jia, Junhao…

July 13, 2025

From Language Models over Tokens to Language Models over Charactersby Tim Vieira, Ben LeBrun, Mario…

July 13, 2025

TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generationby Liao Qu, Huichao Zhang, Yiheng Liu,…

July 13, 2025

Scaling Image Tokenizers with Grouped Spherical Quantizationby Jiangtao Wang, Zhen Qin, Yifan Zhang, Vincent Tao…

July 13, 2025

Arabic-Nougat: Fine-Tuning Vision Transformers for Arabic OCR and Markdown Extractionby Mohamed RashadFirst submitted to arxiv…

July 13, 2025

UniPose: A Unified Multimodal Framework for Human Pose Comprehension, Generation and Editingby Yiheng Li, Ruibing…

July 13, 2025

Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languagesby S. Tamang, D. J.…

July 13, 2025

LARP: Tokenizing Videos with a Learned Autoregressive Generative Priorby Hanyu Wang, Saksham Suri, Yixuan Ren,…

July 13, 2025

Deep Learning Based Dense Retrieval: A Comparative Studyby Ming Zhong, Zhizhi Wu, Nanako HondaFirst submitted…