Artificial intelligence – Page 3627

July 13, 2025

Robust agents learn causal world modelsby Jonathan Richens, Tom EverittFirst submitted to arxiv on: 16…

July 13, 2025

Explainability for Machine Learning Models: From Data Adaptability to User Perceptionby julien DelaunayFirst submitted to…

July 13, 2025

Multi-modal Preference Alignment Remedies Degradation of Visual Instruction Tuning on Language Modelsby Shengzhi Li, Rongyu…

July 13, 2025

Active Preference Optimization for Sample Efficient RLHFby Nirjhar Das, Souradip Chakraborty, Aldo Pacchiano, Sayak Ray…

July 13, 2025

Can Transformers Predict Vibrations?by Fusataka Kuniyoshi, Yoshihide SawadaFirst submitted to arxiv on: 16 Feb 2024CategoriesMain:…

July 13, 2025

Any-Precision LLM: Low-Cost Deployment of Multiple, Different-Sized LLMsby Yeonhong Park, Jake Hyun, SangLyul Cho, Bonggeun…

July 13, 2025

Properties and Challenges of LLM-Generated Explanationsby Jenny Kunz, Marco KuhlmannFirst submitted to arxiv on: 16…

July 13, 2025

Personalised Drug Identifier for Cancer Treatment with Transformers using Auxiliary Informationby Aishwarya Jayagopal, Hansheng Xue,…

July 13, 2025

Direct Preference Optimization with an Offsetby Afra Amini, Tim Vieira, Ryan CotterellFirst submitted to arxiv…

July 13, 2025

Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identificationby Chao Qin, Daniel…