Pretraining – Page 4 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Teasergen: Generating Teasers For Long Documentaries, by Weihan Xu et al.

TeaserGen: Generating Teasers for Long Documentariesby Weihan Xu, Paul Pu Liang, Haven Kim, Julian McAuley,…

July 13, 2025

Summary of Vector-icl: In-context Learning with Continuous Vector Representations, by Yufan Zhuang et al.

Vector-ICL: In-context Learning with Continuous Vector Representationsby Yufan Zhuang, Chandan Singh, Liyuan Liu, Jingbo Shang,…

July 13, 2025

Summary of Codepmp: Scalable Preference Model Pretraining For Large Language Model Reasoning, by Huimu Yu et al.

CodePMP: Scalable Preference Model Pretraining for Large Language Model Reasoningby Huimu Yu, Xing Wu, Weidong…

July 13, 2025

Summary of Knowledge Entropy Decay During Language Model Pretraining Hinders New Knowledge Acquisition, by Jiyeon Kim et al.

Knowledge Entropy Decay during Language Model Pretraining Hinders New Knowledge Acquisitionby Jiyeon Kim, Hyunji Lee,…

July 13, 2025

Summary of Map: Unleashing Hybrid Mamba-transformer Vision Backbone’s Potential with Masked Autoregressive Pretraining, by Yunze Liu et al.

MAP: Unleashing Hybrid Mamba-Transformer Vision Backbone’s Potential with Masked Autoregressive Pretrainingby Yunze Liu, Li YiFirst…

July 13, 2025

Summary of Procedure-aware Surgical Video-language Pretraining with Hierarchical Knowledge Augmentation, by Kun Yuan et al.

Procedure-Aware Surgical Video-language Pretraining with Hierarchical Knowledge Augmentationby Kun Yuan, Vinkle Srivastav, Nassir Navab, Nicolas…

July 13, 2025

Summary of Uniemox: Cross-modal Semantic-guided Large-scale Pretraining For Universal Scene Emotion Perception, by Chuang Chen et al.

UniEmoX: Cross-modal Semantic-Guided Large-Scale Pretraining for Universal Scene Emotion Perceptionby Chuang Chen, Xiao Sun, Zhi…

July 13, 2025

Summary of Enhancing Elusive Clues in Knowledge Learning by Contrasting Attention Of Language Models, By Jian Gao et al.

Enhancing elusive clues in knowledge learning by contrasting attention of language modelsby Jian Gao, Xiao…

July 13, 2025

Summary of Efficientcracknet: a Lightweight Model For Crack Segmentation, by Abid Hasan Zim et al.

EfficientCrackNet: A Lightweight Model for Crack Segmentationby Abid Hasan Zim, Aquib Iqbal, Zaid Al-Huda, Asad…