Optimization – Page 12 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Rethinking Data Synthesis: a Teacher Model Training Recipe with Interpretation, by Yifang Chen et al.

Rethinking Data Synthesis: A Teacher Model Training Recipe with Interpretationby Yifang Chen, David Zhu, Simon…

July 13, 2025

Summary of Paved or Unpaved? a Deep Learning Derived Road Surface Global Dataset From Mapillary Street-view Imagery, by Sukanya Randhawa et al.

Paved or unpaved? A Deep Learning derived Road Surface Global Dataset from Mapillary Street-View Imageryby…

July 13, 2025

Summary of Cooperative Strategic Planning Enhances Reasoning Capabilities in Large Language Models, by Danqing Wang et al.

Cooperative Strategic Planning Enhances Reasoning Capabilities in Large Language Modelsby Danqing Wang, Zhuorui Ye, Fei…

July 13, 2025

Summary of Learning From Response Not Preference: a Stackelberg Approach For Llm Detoxification Using Non-parallel Data, by Xinhong Xie et al.

Learning from Response not Preference: A Stackelberg Approach for LLM Detoxification using Non-parallel Databy Xinhong…

July 13, 2025

Summary of Effective Instruction Parsing Plugin For Complex Logical Query Answering on Knowledge Graphs, by Xingrui Zhuo et al.

Effective Instruction Parsing Plugin for Complex Logical Query Answering on Knowledge Graphsby Xingrui Zhuo, Jiapu…

July 13, 2025

Summary of 2d-dpo: Scaling Direct Preference Optimization with 2-dimensional Supervision, by Shilong Li et al.

2D-DPO: Scaling Direct Preference Optimization with 2-Dimensional Supervisionby Shilong Li, Yancheng He, Hui Huang, Xingyuan…

July 13, 2025

Summary of Improving Small-scale Large Language Models Function Calling For Reasoning Tasks, by Graziano A. Manduzio et al.

Improving Small-Scale Large Language Models Function Calling for Reasoning Tasksby Graziano A. Manduzio, Federico A.…

July 13, 2025

Summary of Pract: Optimizing Principled Reasoning and Acting Of Llm Agent, by Zhiwei Liu et al.

PRACT: Optimizing Principled Reasoning and Acting of LLM Agentby Zhiwei Liu, Weiran Yao, Jianguo Zhang,…

July 13, 2025

Summary of Logo — Long Context Alignment Via Efficient Preference Optimization, by Zecheng Tang et al.

LOGO – Long cOntext aliGnment via efficient preference Optimizationby Zecheng Tang, Zechen Sun, Juntao Li,…

July 13, 2025

Summary of Little Giants: Synthesizing High-quality Embedding Data at Scale, by Haonan Chen et al.

Little Giants: Synthesizing High-Quality Embedding Data at Scaleby Haonan Chen, Liang Wang, Nan Yang, Yutao…