Reinforcement learning – Page 24

July 13, 2025

VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generationby Xuan He, Dongfu…

July 13, 2025

Rewarding What Matters: Step-by-Step Reinforcement Learning for Task-Oriented Dialogueby Huifang Du, Shuqin Li, Minghao Wu,…

July 13, 2025

Knowledge Tagging System on Math Questions via LLMs with Flexible Demonstration Retrieverby Hang Li, Tianlong…

July 13, 2025

Trapezoidal Gradient Descent for Effective Reinforcement Learning in Spiking Networksby Yuhao Pan, Xiucheng Wang, Nan…

July 13, 2025

CoDreamer: Communication-Based Decentralised World Modelsby Edan Toledo, Amanda ProrokFirst submitted to arxiv on: 19 Jun…

July 13, 2025

VELO: A Vector Database-Assisted Cloud-Edge Collaborative LLM QoS Optimization Frameworkby Zhi Yao, Zhiqing Tang, Jiong…

July 13, 2025

Oralytics Reinforcement Learning Algorithmby Anna L. Trella, Kelly W. Zhang, Stephanie M. Carpenter, David Elashoff,…

July 13, 2025

ChatPCG: Large Language Model-Driven Reward Design for Procedural Content Generationby In-Chang Baek, Tae-Hwa Park, Jin-Ha…

July 13, 2025

Input Conditioned Graph Generation for Language Agentsby Lukas Vierling, Jie Fu, Kai ChenFirst submitted to…

July 13, 2025

Aligning Large Language Models from Self-Reference AI Feedback with one General Principleby Rong Bao, Rui…