Artificial intelligence – Page 1633

July 13, 2025

Towards Reliable Alignment: Uncertainty-aware RLHFby Debangshu Banerjee, Aditya GopalanFirst submitted to arxiv on: 31 Oct…

July 13, 2025

OCEAN: Offline Chain-of-thought Evaluation and Alignment in Large Language Modelsby Junda Wu, Xintong Li, Ruoyu…

July 13, 2025

A Non-Monolithic Policy Approach of Offline-to-Online Reinforcement Learningby JaeYoon Kim, Junyu Xuan, Christy Liang, Farookh…

July 13, 2025

Multi-fidelity Machine Learning for Uncertainty Quantification and Optimizationby Ruda Zhang, Negin AlemazkoorFirst submitted to arxiv…

July 13, 2025

Keep on Swimming: Real Attackers Only Need Partial Knowledge of a Multi-Model Systemby Julian Collado,…

July 13, 2025

Causality-Driven Audits of Model Robustnessby Nathan Drenkow, Chris Ribaudo, Mathias UnberathFirst submitted to arxiv on:…

July 13, 2025

DASH: Warm-Starting Neural Network Training in Stationary Settings without Loss of Plasticityby Baekrok Shin, Junsoo…

July 13, 2025

Kernel-Based Function Approximation for Average Reward Reinforcement Learning: An Optimist No-Regret Algorithmby Sattar Vakili, Julia…

July 13, 2025

Tangent Space Causal Inference: Leveraging Vector Fields for Causal Discovery in Dynamical Systemsby Kurt Butler,…

July 13, 2025

Development and Comparative Analysis of Machine Learning Models for Hypoxemia Severity Triage in CBRNE Emergency…