Language model – Page 90 – GrooveSquid.com

July 13, 2025

Cascade-Aware Training of Language Modelsby Congchao Wang, Sean Augenstein, Keith Rush, Wittawat Jitkrittum, Harikrishna Narasimhan,…

July 13, 2025

Exploratory Preference Optimization: Harnessing Implicit Q*-Approximation for Sample-Efficient RLHFby Tengyang Xie, Dylan J. Foster, Akshay…

July 13, 2025

What Makes CLIP More Robust to Long-Tailed Pre-Training Data? A Controlled Study for Transferable Insightsby…

July 13, 2025

PostDoc: Generating Poster from a Long Multimodal Document Using Deep Submodular Optimizationby Vijay Jaisankar, Sambaran…

July 13, 2025

CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learningby Yiping Wang, Yifang Chen, Wendan…

July 13, 2025

Robust Preference Optimization through Reward Model Distillationby Adam Fisch, Jacob Eisenstein, Vicky Zayats, Alekh Agarwal,…

July 13, 2025

MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Seriesby Ge Zhang, Scott Qu, Jiaheng…

July 13, 2025

Robust Optimization in Protein Fitness Landscapes Using Reinforcement Learning in Latent Spaceby Minji Lee, Luiz…

July 13, 2025

Knowledge Circuits in Pretrained Transformersby Yunzhi Yao, Ningyu Zhang, Zekun Xi, Mengru Wang, Ziwen Xu,…

July 13, 2025

CLAIM Your Data: Enhancing Imputation Accuracy with Contextual Large Language Modelsby Ahatsham Hayat, Mohammad Rashedul…