Supervised – Page 99 – GrooveSquid.com

July 13, 2025

Measuring and Reducing LLM Hallucination without Gold-Standard Answersby Jiaheng Wei, Yuanshun Yao, Jean-Francois Ton, Hongyi…

July 13, 2025

Transductive Learning Is Compactby Julian Asilis, Siddartha Devic, Shaddin Dughmi, Vatsal Sharan, Shang-Hua TengFirst submitted…

July 13, 2025

Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustmentby Rui Yang, Xiaoman Pan, Feng…

July 13, 2025

Self-Play Fine-Tuning of Diffusion Models for Text-to-Image Generationby Huizhuo Yuan, Zixiang Chen, Kaixuan Ji, Quanquan…

July 13, 2025

RS-DPO: A Hybrid Rejection Sampling and Direct Preference Optimization Method for Alignment of Large Language…

July 13, 2025

Node Duplication Improves Cold-start Link Predictionby Zhichun Guo, Tong Zhao, Yozen Liu, Kaiwen Dong, William…

July 13, 2025

Learning Interpretable Policies in Hindsight-Observable POMDPs through Partially Supervised Reinforcement Learningby Michael Lanier, Ying Xu,…

July 13, 2025

Comparing supervised learning dynamics: Deep neural networks match human data efficiency but show a generalisation…

July 13, 2025

Embracing the black box: Heading towards foundation models for causal discovery from time series databy…

July 13, 2025

Weakly Supervised Segmentation of Vertebral Bodies with Iterative Slice-propagationby Shiqi Peng, Bolin Lai, Guangyu Yao,…