Reinforcement learning – Page 94

July 13, 2025

Text2Chart31: Instruction Tuning for Chart Generation with Automatic Feedbackby Fatemeh Pesaran Zadeh, Juyeon Kim, Jin-Hwa…

July 13, 2025

Towards Scalable General Utility Reinforcement Learning: Occupancy Approximation, Sample Complexity and Global Optimalityby Anas Barakat,…

July 13, 2025

Model-Based Reward Shaping for Adversarial Inverse Reinforcement Learning in Stochastic Environmentsby Simon Sinong Zhan, Qingyuan…

July 13, 2025

Solving Dual Sourcing Problems with Supply Mode Dependent Failure Ratesby Fabian Akkerman, Nils Knofius, Matthieu…

July 13, 2025

Towards Cost Sensitive Decision Makingby Yang Li, Junier OlivaFirst submitted to arxiv on: 4 Oct…

July 13, 2025

Distribution Guided Active Feature Acquisitionby Yang Li, Junier OlivaFirst submitted to arxiv on: 4 Oct…

July 13, 2025

Hidden in Plain Text: Emergence & Mitigation of Steganographic Collusion in LLMsby Yohan Mathew, Ollie…

July 13, 2025

Topological Foundations of Reinforcement Learningby David Krame KadurhaFirst submitted to arxiv on: 25 Sep 2024CategoriesMain:…

July 13, 2025

Open-World Reinforcement Learning over Long Short-Term Imaginationby Jiajian Li, Qi Wang, Yunbo Wang, Xin Jin,…

July 13, 2025

Predictive Coding for Decision Transformerby Tung M. Luu, Donghoon Lee, Chang D. YooFirst submitted to…