GPT – Page 105 – GrooveSquid.com

July 13, 2025

Rethinking Legal Judgement Prediction in a Realistic Scenario in the Era of Large Language Modelsby…

July 13, 2025

FormalAlign: Automated Alignment Evaluation for Autoformalizationby Jianqiao Lu, Yingjia Wan, Yinya Huang, Jing Xiong, Zhengying…

July 13, 2025

Can In-context Learning Really Generalize to Out-of-distribution Tasks?by Qixun Wang, Yifei Wang, Yisen Wang, Xianghua…

July 13, 2025

Diagnosing Robotics Systems Issues with Large Language Modelsby Jordis Emilia Herrmann, Aswath Mandakath Gopinath, Mikael…

July 13, 2025

Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT…

July 13, 2025

Benchmarking Agentic Workflow Generationby Shuofei Qiao, Runnan Fang, Zhisong Qiu, Xiaobin Wang, Ningyu Zhang, Yong…

July 13, 2025

PLaMo-100B: A Ground-Up Language Model Designed for Japanese Proficiencyby Preferred Elements, Kenshin Abe, Kaizaburo Chubachi,…

July 13, 2025

SAGE: Scalable Ground Truth Evaluations for Large Sparse Autoencodersby Constantin Venhoff, Anisoara Calinescu, Philip Torr,…

July 13, 2025

ETA: Evaluating Then Aligning Safety of Vision Language Models at Inference Timeby Yi Ding, Bolian…

July 13, 2025

LLM Self-Correction with DeCRIM: Decompose, Critique, and Refine for Enhanced Following of Instructions with Multiple…