Probability – Page 60 – GrooveSquid.com

July 13, 2025

Summary of Group Robust Preference Optimization in Reward-free Rlhf, by Shyam Sundhar Ramesh et al.

Group Robust Preference Optimization in Reward-free RLHFby Shyam Sundhar Ramesh, Yifan Hu, Iason Chaimalas, Viraj…

July 13, 2025

Summary of Estimating Before Debiasing: a Bayesian Approach to Detaching Prior Bias in Federated Semi-supervised Learning, by Guogang Zhu et al.

Estimating before Debiasing: A Bayesian Approach to Detaching Prior Bias in Federated Semi-Supervised Learningby Guogang…

July 13, 2025

Summary of Reconciling Model Multiplicity For Downstream Decision Making, by Ally Yalei Du et al.

Reconciling Model Multiplicity for Downstream Decision Makingby Ally Yalei Du, Dung Daniel Ngo, Zhiwei Steven…

July 13, 2025

Summary of Weak-to-strong Search: Align Large Language Models Via Searching Over Small Language Models, by Zhanhui Zhou et al.

Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Modelsby Zhanhui Zhou, Zhixuan…

July 13, 2025

Summary of Generalized Neyman Allocation For Locally Minimax Optimal Best-arm Identification, by Masahiro Kato

Generalized Neyman Allocation for Locally Minimax Optimal Best-Arm Identificationby Masahiro KatoFirst submitted to arxiv on:…

July 13, 2025

Summary of Inference-time Alignment Of Diffusion Models with Direct Noise Optimization, by Zhiwei Tang et al.

Inference-Time Alignment of Diffusion Models with Direct Noise Optimizationby Zhiwei Tang, Jiangweizhi Peng, Jiasheng Tang,…

July 13, 2025

Summary of Quantitative Certification Of Bias in Large Language Models, by Isha Chaudhary et al.

Quantitative Certification of Bias in Large Language Modelsby Isha Chaudhary, Qian Hu, Manoj Kumar, Morteza…

July 13, 2025

Summary of Fast Explanations Via Policy Gradient-optimized Explainer, by Deng Pan et al.

Fast Explanations via Policy Gradient-Optimized Explainerby Deng Pan, Nuno Moniz, Nitesh ChawlaFirst submitted to arxiv…

July 13, 2025

Summary of Probabilistically Plausible Counterfactual Explanations with Normalizing Flows, by Patryk Wielopolski et al.

Probabilistically Plausible Counterfactual Explanations with Normalizing Flowsby Patryk Wielopolski, Oleksii Furman, Jerzy Stefanowski, Maciej ZiębaFirst…

July 13, 2025

Summary of A Closer Look at Time Steps Is Worthy Of Triple Speed-up For Diffusion Model Training, by Kai Wang et al.

A Closer Look at Time Steps is Worthy of Triple Speed-Up for Diffusion Model Trainingby…