Artificial intelligence – Page 1866

July 13, 2025

Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decompositionby Zhong Zheng, Haochen Zhang, Lingzhou XueFirst submitted to…

July 13, 2025

Boosting Deep Ensembles with Learning Rate Tuningby Hongpeng Jin, Yanzhao WuFirst submitted to arxiv on:…

July 13, 2025

Detecting Training Data of Large Language Models via Expectation Maximizationby Gyuwan Kim, Yang Li, Evangelia…

July 13, 2025

A Variational Bayesian Inference Theory of Elasticity and Its Mixed Probabilistic Finite Element Method for…

July 13, 2025

CSA: Data-efficient Mapping of Unimodal Features to Multimodal Featuresby Po-han Li, Sandeep P. Chinchali, Ufuk…

July 13, 2025

Parallel Digital Twin-driven Deep Reinforcement Learning for User Association and Load Balancing in Dynamic Wireless…

July 13, 2025

Automatic Curriculum Expert Iteration for Reliable LLM Reasoningby Zirui Zhao, Hanze Dong, Amrita Saha, Caiming…

July 13, 2025

The Plug-in Approach for Average-Reward and Discounted MDPs: Optimal Sample Complexity Analysisby Matthew Zurek, Yudong…

July 13, 2025

Almost Minimax Optimal Best Arm Identification in Piecewise Stationary Linear Banditsby Yunlong Hou, Vincent Y.…

July 13, 2025

On Reward Transferability in Adversarial Inverse Reinforcement Learning: Insights from Random Matrix Theoryby Yangchun Zhang,…