Pretraining – Page 9 – GrooveSquid.com

July 13, 2025

Zyda: A 1.3T Dataset for Open Language Modelingby Yury Tokpanov, Beren Millidge, Paolo Glorioso, Jonathan…

July 13, 2025

Multimodal Reasoning with Multimodal Knowledge Graphby Junlin Lee, Yequan Wang, Jing Li, Min ZhangFirst submitted…

July 13, 2025

Enhancing Inertial Hand based HAR through Joint Representation of Language, Pose and Synthetic IMUsby Vitor…

July 13, 2025

MLIP: Efficient Multi-Perspective Language-Image Pretraining with Exhaustive Data Utilizationby Yu Zhang, Qi Zhang, Zixuan Gong,…

July 13, 2025

LongSkywork: A Training Recipe for Efficiently Extending Context Length in Large Language Modelsby Liang Zhao,…

July 13, 2025

Jina CLIP: Your CLIP Model Is Also Your Text Retrieverby Andreas Koukounas, Georgios Mastrapas, Michael…

July 13, 2025

Language Models Trained to do Arithmetic Predict Human Risky and Intertemporal Choiceby Jian-Qiao Zhu, Haijiang…

July 13, 2025

JADS: A Framework for Self-supervised Joint Aspect Discovery and Summarizationby Xiaobo Guo, Jay Desai, Srinivasan…

July 13, 2025

Learning Shared RGB-D Fields: Unified Self-supervised Pre-training for Label-efficient LiDAR-Camera 3D Perceptionby Xiaohao Xu, Ye…

July 13, 2025

TokenUnify: Scalable Autoregressive Visual Pre-training with Mixture Token Predictionby Yinda Chen, Haoyuan Shi, Xiaoyu Liu,…