Optimization – Page 230 – GrooveSquid.com

July 13, 2025

Statistical Properties of Robust Satisficingby Zhiyi Li, Yunbei Xu, Ruohan ZhanFirst submitted to arxiv on:…

July 13, 2025

Performance of NPG in Countable State-Space Average-Cost RLby Yashaswini Murthy, Isaac Grosof, Siva Theja Maguluri,…

July 13, 2025

Group Robust Preference Optimization in Reward-free RLHFby Shyam Sundhar Ramesh, Yifan Hu, Iason Chaimalas, Viraj…

July 13, 2025

Linear Function Approximation as a Computationally Efficient Method to Solve Classical Reinforcement Learning Challengesby Hari…

July 13, 2025

Quantitative Convergences of Lie Group Momentum Optimizersby Lingkai Kong, Molei TaoFirst submitted to arxiv on:…

July 13, 2025

XPrompt:Explaining Large Language Model’s Generation via Joint Prompt Attributionby Yurui Chang, Bochuan Cao, Yujia Wang,…

July 13, 2025

Boost Your Own Human Image Generation Model via Direct Preference Optimization with AI Feedbackby Sanghyeon…

July 13, 2025

Would I Lie To You? Inference Time Alignment of Language Models using Direct Preference Headsby…

July 13, 2025

Few for Many: Tchebycheff Set Scalarization for Many-Objective Optimizationby Xi Lin, Yilu Liu, Xiaoyuan Zhang,…

July 13, 2025

Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Modelsby Masatoshi Uehara, Yulai…