Artificial intelligence – Page 2233

July 13, 2025

Pareto Inverse Reinforcement Learning for Diverse Expert Policy Generationby Woo Kyung Kim, Minjong Yoo, Honguk…

July 13, 2025

Pareto Merging: Multi-Objective Optimization for Preference-Aware Model Mergingby Weiyu Chen, James KwokFirst submitted to arxiv…

July 13, 2025

Balancing Act: Prioritization Strategies for LLM-Designed Restless Bandit Rewardsby Shresth Verma, Niclas Boehmer, Lingkai Kong,…

July 13, 2025

Critique-out-Loud Reward Modelsby Zachary Ankner, Mansheej Paul, Brandon Cui, Jonathan D. Chang, Prithviraj AmmanabroluFirst submitted…

July 13, 2025

Approaching Deep Learning through the Spectral Dynamics of Weightsby David Yunis, Kumar Kshitij Patel, Samuel…

July 13, 2025

LLM Pruning and Distillation in Practice: The Minitron Approachby Sharath Turuvekere Sreenivas, Saurav Muralidharan, Raviraj…

July 13, 2025

Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstractionby Anthony GX-Chen, Kenneth Marino,…

July 13, 2025

FAKER: Full-body Anonymization with Human Keypoint Extraction for Real-time Video Deidentificationby Byunghyun Ban, Hyoseok LeeFirst…

July 13, 2025

Fast Training Dataset Attribution via In-Context Learningby Milad Fotouhi, Mohammad Taha Bahadori, Oluwaseyi Feyisetan, Payman…

July 13, 2025

MicroXercise: A Micro-Level Comparative and Explainable System for Remote Physical Therapyby Hanchen David Wang, Nibraas…