Artificial intelligence – Page 3637

July 13, 2025

OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Datasetby Shubham Toshniwal, Ivan Moshkov, Sean Narenthiran, Daria…

July 13, 2025

Large Scale Constrained Clustering With Reinforcement Learningby Benedikt Schesch, Marco CasertaFirst submitted to arxiv on:…

July 13, 2025

Reward Generalization in RLHF: A Topological Perspectiveby Tianyi Qiu, Fanzhi Zeng, Jiaming Ji, Dong Yan,…

July 13, 2025

Crafting a Good Prompt or Providing Exemplary Dialogues? A Study of In-Context Learning for Persona-based…

July 13, 2025

Why are Sensitive Functions Hard for Transformers?by Michael Hahn, Mark RofinFirst submitted to arxiv on:…

July 13, 2025

Hierarchy Representation of Data in Machine Learningsby Han Yegang, Park Minjun, Byun Duwon, Park InkyuFirst…

July 13, 2025

Accelerating Parallel Sampling of Diffusion Modelsby Zhiwei Tang, Jiasheng Tang, Hao Luo, Fan Wang, Tsung-Hui…

July 13, 2025

Data Augmentation and Transfer Learning Approaches Applied to Facial Expressions Recognitionby Enrico Randellini, Leonardo Rigutini,…

July 13, 2025

Fast Vocabulary Transfer for Language Model Compressionby Leonidas Gee, Andrea Zugarini, Leonardo Rigutini, Paolo TorroniFirst…

July 13, 2025

Symmetry-Breaking Augmentations for Ad Hoc Teamworkby Ravi Hammond, Dustin Craggs, Mingyu Guo, Jakob Foerster, Ian…