Artificial intelligence – Page 3446

July 13, 2025

ALaRM: Align Language Models via Hierarchical Rewards Modelingby Yuhang Lai, Siyuan Wang, Shujun Liu, Xuanjing…

July 13, 2025

Average Calibration Error: A Differentiable Loss for Improved Reliability in Image Segmentationby Theodore Barfoot, Luis…

July 13, 2025

XB-MAML: Learning Expandable Basis Parameters for Effective Meta-Learning with Wide Task Coverageby Jae-Jun Lee, Sung…

July 13, 2025

Leveraging Internal Representations of Model for Magnetic Image Classificationby Adarsh N L, Arun P V,…

July 13, 2025

Multistep Consistency Modelsby Jonathan Heek, Emiel Hoogeboom, Tim SalimansFirst submitted to arxiv on: 11 Mar…

July 13, 2025

On the Global Convergence of Policy Gradient in Average Reward Markov Decision Processesby Navdeep Kumar,…

July 13, 2025

Monotone Individual Fairnessby Yahav BechavodFirst submitted to arxiv on: 11 Mar 2024CategoriesMain: Machine Learning (cs.LG)Secondary:…

July 13, 2025

Efficient first-order algorithms for large-scale, non-smooth maximum entropy models with application to wildfire scienceby Gabriel…

July 13, 2025

In-context Exploration-Exploitation for Reinforcement Learningby Zhenwen Dai, Federico Tomasi, Sina GhiassianFirst submitted to arxiv on:…

July 13, 2025

Constructing Variables Using Classifiers as an Aid to Regression: An Empirical Assessmentby Colin Troisemaine, Vincent…