Optimization – Page 201 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Step-dpo: Step-wise Preference Optimization For Long-chain Reasoning Of Llms, by Xin Lai et al.

Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMsby Xin Lai, Zhuotao Tian, Yukang Chen,…

July 13, 2025

Summary of Improving Hyperparameter Optimization with Checkpointed Model Weights, by Nikhil Mehta et al.

Improving Hyperparameter Optimization with Checkpointed Model Weightsby Nikhil Mehta, Jonathan Lorraine, Steve Masson, Ramanathan Arunachalam,…

July 13, 2025

Summary of Spatial-temporal Hierarchical Reinforcement Learning For Interpretable Pathology Image Super-resolution, by Wenting Chen et al.

Spatial-temporal Hierarchical Reinforcement Learning for Interpretable Pathology Image Super-Resolutionby Wenting Chen, Jie Liu, Tommy W.S.…

July 13, 2025

Summary of An Autotuning-based Optimization Framework For Mixed-kernel Svm Classifications in Smart Pixel Datasets and Heterojunction Transistors, by Xingfu Wu and Tupendra Oli and Justin H. Qian and Valerie Taylor and Mark C. Hersam and Vinod K. Sangwan

An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistorsby…

July 13, 2025

Summary of Why Line Search When You Can Plane Search? So-friendly Neural Networks Allow Per-iteration Optimization Of Learning and Momentum Rates For Every Layer, by Betty Shea et al.

Why Line Search when you can Plane Search? SO-Friendly Neural Networks allow Per-Iteration Optimization of…

July 13, 2025

Summary of Bidirectional-reachable Hierarchical Reinforcement Learning with Mutually Responsive Policies, by Yu Luo et al.

Bidirectional-Reachable Hierarchical Reinforcement Learning with Mutually Responsive Policiesby Yu Luo, Fuchun Sun, Tianying Ji, Xianyuan…

July 13, 2025

Summary of Efficient and Effective Implicit Dynamic Graph Neural Network, by Yongjian Zhong et al.

Efficient and Effective Implicit Dynamic Graph Neural Networkby Yongjian Zhong, Hieu Vu, Tianbao Yang, Bijaya…

July 13, 2025

Summary of Grass: Compute Efficient Low-memory Llm Training with Structured Sparse Gradients, by Aashiq Muhamed et al.

Grass: Compute Efficient Low-Memory LLM Training with Structured Sparse Gradientsby Aashiq Muhamed, Oscar Li, David…

July 13, 2025

Summary of Fedbiot: Llm Local Fine-tuning in Federated Learning Without Full Model, by Feijie Wu et al.

FedBiOT: LLM Local Fine-tuning in Federated Learning without Full Modelby Feijie Wu, Zitao Li, Yaliang…

July 13, 2025

Summary of A New Perspective on Shampoo’s Preconditioner, by Depen Morwani et al.

A New Perspective on Shampoo’s Preconditionerby Depen Morwani, Itai Shapira, Nikhil Vyas, Eran Malach, Sham…