Optimization – Page 15 – GrooveSquid.com

July 13, 2025

TPO: Aligning Large Language Models with Multi-branch & Multi-step Preference Treesby Weibin Liao, Xu Chu,…

July 13, 2025

PRefLexOR: Preference-based Recursive Language Modeling for Exploratory Optimization of Reasoning and Agentic Thinkingby Markus J.…

July 13, 2025

Planning Anything with Rigor: General-Purpose Zero-Shot Planning with LLM-based Formalized Programmingby Yilun Hao, Yang Zhang,…

July 13, 2025

Improving the Language Understanding Capabilities of Large Language Models Using Reinforcement Learningby Bokai Hu, Sai…

July 13, 2025

Varying Shades of Wrong: Aligning LLMs with Wrong Answers Onlyby Jihan Yao, Wenxuan Ding, Shangbin…

July 13, 2025

Thinking LLMs: General Instruction Following with Thought Generationby Tianhao Wu, Janice Lan, Weizhe Yuan, Jiantao…

July 13, 2025

EasyRAG: Efficient Retrieval-Augmented Generation Framework for Automated Network Operationsby Zhangchi Feng, Dongdong Kuang, Zhongyuan Wang,…

July 13, 2025

Resource-Constrained Heuristic for Max-SATby Brian Matejek, Daniel Elenius, Cale Gentry, David Stoker, Adam CobbFirst submitted…

July 13, 2025

Recent advancements in LLM Red-Teaming: Techniques, Defenses, and Ethical Considerationsby Tarun Raheja, Nilay Pochhi, F.D.C.M.…

July 13, 2025

Online design of dynamic networksby Duo Wang, Andrea Araldo, Mounim El YacoubiFirst submitted to arxiv…