Reinforcement learning – Page 16

July 13, 2025

Atoxia: Red-teaming Large Language Models with Target Toxic Answersby Yuhao Du, Zhuo Li, Pengyu Cheng,…

July 13, 2025

Enhancing Analogical Reasoning in the Abstraction and Reasoning Corpus via Model-Based RLby Jihwan Lee, Woochang…

July 13, 2025

DynamicRouteGPT: A Real-Time Multi-Vehicle Dynamic Navigation Framework Based on Large Language Modelsby Ziai Zhou, Bin…

July 13, 2025

Multi-Agent Target Assignment and Path Finding for Intelligent Warehouse: A Cooperative Multi-Agent Deep Reinforcement Learning…

July 13, 2025

DutyTTE: Deciphering Uncertainty in Origin-Destination Travel Time Estimationby Xiaowei Mao, Yan Lin, Shengnan Guo, Yubin…

July 13, 2025

Intelligent OPC Engineer Assistant for Semiconductor Manufacturingby Guojin Chen, Haoyu Yang, Bei Yu, Haoxing RenFirst…

July 13, 2025

S-EPOA: Overcoming the Indistinguishability of Segments with Skill-Driven Preference-Based Reinforcement Learningby Ni Mu, Yao Luan,…

July 13, 2025

Bridging Large Language Models and Optimization: A Unified Framework for Text-attributed Combinatorial Optimizationby Xia Jiang,…

July 13, 2025

SCREENER: A general framework for task-specific experiment design in quantitative MRIby Tianshu Zheng, Zican Wang,…

July 13, 2025

Advances in Preference-based Reinforcement Learning: A Reviewby Youssef Abdelkareem, Shady Shehata, Fakhri KarrayFirst submitted to…