Online learning – Page 3 – GrooveSquid.com

July 13, 2025

FM3Q: Factorized Multi-Agent MiniMax Q-Learning for Two-Team Zero-Sum Markov Gameby Guangzheng Hu, Yuanheng Zhu, Haoran…

July 13, 2025

CAREForMe: Contextual Multi-Armed Bandit Recommendation Framework for Mental Healthby Sheng Yu, Narjes Nourzad, Randye J.…

July 13, 2025

Effective and secure federated online learning to rankby Shuyi WangFirst submitted to arxiv on: 26…

July 13, 2025

Optimistic Critic Reconstruction and Constrained Fine-Tuning for General Offline-to-Online RLby Qin-Wen Luo, Ming-Kun Xie, Ye-Wen…

July 13, 2025

Be More Diverse than the Most Diverse: Online Selection of Diverse Mixtures of Generative Modelsby…

July 13, 2025

Algorithm Design for Continual Learning in IoT Networksby Shugang Hao, Lingjie DuanFirst submitted to arxiv…

July 13, 2025

Online Preference-based Reinforcement Learning with Self-augmented Feedback from Large Language Modelby Songjun Tu, Jingbo Sun,…

July 13, 2025

Knowledge Distillation in RNN-Attention Models for Early Prediction of Student Performanceby Sukrit Leelaluk, Cheng Tang,…

July 13, 2025

Balans: Multi-Armed Bandits-based Adaptive Large Neighborhood Search for Mixed-Integer Programming Problemby Junyang Cai, Serdar Kadioglu,…

July 13, 2025

Incremental Online Learning of Randomized Neural Network with Forward Regularizationby Junda Wang, Minghui Hu, Ning…