Artificial intelligence – Page 2610

July 13, 2025

Jacobian Descent for Multi-Objective Optimizationby Pierre Quinton, Valérian ReyFirst submitted to arxiv on: 23 Jun…

July 13, 2025

Gradual Divergence for Seamless Adaptation: A Novel Domain Incremental Learning Methodby Kishaan Jeeveswaran, Elahe Arani,…

July 13, 2025

Preference Tuning For Toxicity Mitigation Generalizes Across Languagesby Xiaochen Li, Zheng-Xin Yong, Stephen H. BachFirst…

July 13, 2025

Position: Benchmarking is Limited in Reinforcement Learning Researchby Scott M. Jordan, Adam White, Bruno Castro…

July 13, 2025

An Optimal Tightness Bound for the Simulation Lemmaby Sam Lobel, Ronald ParrFirst submitted to arxiv…

July 13, 2025

Confidence Regulation Neurons in Language Modelsby Alessandro Stolfo, Ben Wu, Wes Gurnee, Yonatan Belinkov, Xingyi…

July 13, 2025

Graph-Augmented LLMs for Personalized Health Insights: A Case Study in Sleep Analysisby Ajan Subramanian, Zhongqi…

July 13, 2025

Reducing Fine-Tuning Memory Overhead by Approximate and Memory-Sharing Backpropagationby Yuchen Yang, Yingdong Shi, Cheems Wang,…

July 13, 2025

Uncertainty-Aware Reward-Free Exploration with General Function Approximationby Junkai Zhang, Weitong Zhang, Dongruo Zhou, Quanquan GuFirst…

July 13, 2025

Towards Scalable Exact Machine Unlearning Using Parameter-Efficient Fine-Tuningby Somnath Basu Roy Chowdhury, Krzysztof Choromanski, Arijit…