Language model – Page 22 – GrooveSquid.com

July 13, 2025

Project SHADOW: Symbolic Higher-order Associative Deductive reasoning On Wikidata using LM probingby Hanna Abi AklFirst…

July 13, 2025

DHP Benchmark: Are LLMs Good NLG Evaluators?by Yicheng Wang, Jiayi Yuan, Yu-Neng Chuang, Zhuoer Wang,…

July 13, 2025

LLMs are Superior Feedback Providers: Bootstrapping Reasoning for Lie Detection with Self-Generated Feedbackby Tanushree Banerjee,…

July 13, 2025

No Dataset Needed for Downstream Knowledge Benchmarking: Response Dispersion Inversely Correlates with Accuracy on Domain-specific…

July 13, 2025

SimBench: A Rule-Based Multi-Turn Interaction Benchmark for Evaluating an LLM’s Ability to Generate Digital Twinsby…

July 13, 2025

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Modelby Chunting Zhou, Lili…

July 13, 2025

MEGen: Generative Backdoor in Large Language Models via Model Editingby Jiyang Qiu, Xinbei Ma, Zhuosheng…

July 13, 2025

QPO: Query-dependent Prompt Optimization via Multi-Loop Offline Reinforcement Learningby Yilun Kong, Hangyu Mao, Qi Zhao,…

July 13, 2025

Data Augmentation Integrating Dialogue Flow and Style to Adapt Spoken Dialogue Systems to Low-Resource User…

July 13, 2025

Importance Weighting Can Help Large Language Models Self-Improveby Chunyang Jiang, Chi-min Chan, Wei Xue, Qifeng…