Alignment – Page 9 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Combining Domain and Alignment Vectors to Achieve Better Knowledge-safety Trade-offs in Llms, by Megh Thakkar et al.

Combining Domain and Alignment Vectors to Achieve Better Knowledge-Safety Trade-offs in LLMsby Megh Thakkar, Yash…

July 13, 2025

Summary of Aquila-plus: Prompt-driven Visual-language Models For Pixel-level Remote Sensing Image Understanding, by Kaixuan Lu

Aquila-plus: Prompt-Driven Visual-Language Models for Pixel-Level Remote Sensing Image Understandingby Kaixuan LuFirst submitted to arxiv…

July 13, 2025

Summary of Iopo: Empowering Llms with Complex Instruction Following Via Input-output Preference Optimization, by Xinghua Zhang et al.

IOPO: Empowering LLMs with Complex Instruction Following via Input-Output Preference Optimizationby Xinghua Zhang, Haiyang Yu,…

July 13, 2025

Summary of Aquila: a Hierarchically Aligned Visual-language Model For Enhanced Remote Sensing Image Comprehension, by Kaixuan Lu et al.

Aquila: A Hierarchically Aligned Visual-Language Model for Enhanced Remote Sensing Image Comprehensionby Kaixuan Lu, Ruiqian…

July 13, 2025

Summary of Benchmarking Distributional Alignment Of Large Language Models, by Nicole Meister et al.

Benchmarking Distributional Alignment of Large Language Modelsby Nicole Meister, Carlos Guestrin, Tatsunori HashimotoFirst submitted to…

July 13, 2025

Summary of Rethinking Bradley-terry Models in Preference-based Reward Modeling: Foundations, Theory, and Alternatives, by Hao Sun et al.

Rethinking Bradley-Terry Models in Preference-Based Reward Modeling: Foundations, Theory, and Alternativesby Hao Sun, Yunyi Shen,…

July 13, 2025

Summary of Bottom-up and Top-down Analysis Of Values, Agendas, and Observations in Corpora and Llms, by Scott E. Friedman et al.

Bottom-Up and Top-Down Analysis of Values, Agendas, and Observations in Corpora and LLMsby Scott E.…

July 13, 2025

Summary of Combining Theory Of Mind and Kindness For Self-supervised Human-ai Alignment, by Joshua T. S. Hewson

Combining Theory of Mind and Kindness for Self-Supervised Human-AI Alignmentby Joshua T. S. HewsonFirst submitted…

July 13, 2025

Summary of Smoa: Improving Multi-agent Large Language Models with Sparse Mixture-of-agents, by Dawei Li et al.

SMoA: Improving Multi-agent Large Language Models with Sparse Mixture-of-Agentsby Dawei Li, Zhen Tan, Peijia Qian,…

July 13, 2025

Summary of Todo: Enhancing Llm Alignment with Ternary Preferences, by Yuxiang Guo et al.

TODO: Enhancing LLM Alignment with Ternary Preferencesby Yuxiang Guo, Lu Yin, Bo Jiang, Jiaqi ZhangFirst…