Reinforcement learning – Page 79

July 13, 2025

Optimizing Load Scheduling in Power Grids Using Reinforcement Learning and Markov Decision Processesby Dongwen LuoFirst…

July 13, 2025

Hierarchical Multi-agent Reinforcement Learning for Cyber Network Defenseby Aditya Vikram Singh, Ethan Rathbun, Emma Graham,…

July 13, 2025

Episodic Future Thinking Mechanism for Multi-agent Reinforcement Learningby Dongsu Lee, Minhae KwonFirst submitted to arxiv…

July 13, 2025

Meta Stackelberg Game: Robust Federated Learning against Adaptive and Mixed Poisoning Attacksby Tao Li, Henger…

July 13, 2025

DROP: Distributional and Regular Optimism and Pessimism for Reinforcement Learningby Taisuke KobayashiFirst submitted to arxiv…

July 13, 2025

Large Language Models are In-context Preference Learnersby Chao Yu, Qixin Tan, Hong Lu, Jiaxuan Gao,…

July 13, 2025

Optimal Design for Reward Modeling in RLHFby Antoine Scheid, Etienne Boursier, Alain Durmus, Michael I.…

July 13, 2025

Exploring RL-based LLM Training for Formal Language Tasks with Programmed Rewardsby Alexander G. Padula, Dennis…

July 13, 2025

LLM-Assisted Red Teaming of Diffusion Models through “Failures Are Fated, But Can Be Faded”by Som…

July 13, 2025

Corrected Soft Actor Critic for Continuous Controlby Yanjun Chen, Xinming Zhang, Xianghui Wang, Zhiqiang Xu,…