Fine tuning – Page 85 – GrooveSquid.com

July 13, 2025

R-Judge: Benchmarking Safety Risk Awareness for LLM Agentsby Tongxin Yuan, Zhiwei He, Lingzhong Dong, Yiming…

July 13, 2025

xCoT: Cross-lingual Instruction Tuning for Cross-lingual Chain-of-Thought Reasoningby Linzheng Chai, Jian Yang, Tao Sun, Hongcheng…

July 13, 2025

An EcoSage Assistant: Towards Building A Multimodal Plant Care Dialogue Assistantby Mohit Tomar, Abhisek Tiwari,…

July 13, 2025

PokerGPT: An End-to-End Lightweight Solver for Multi-Player Texas Hold’em via Large Language Modelby Chenghao Huang,…

July 13, 2025

Universal Vulnerabilities in Large Language Models: Backdoor Attacks for In-context Learningby Shuai Zhao, Meihuizi Jia,…

July 13, 2025

Chain of History: Learning and Forecasting with LLMs for Temporal Knowledge Graph Completionby Ruilin Luo,…

July 13, 2025

POMP: Probability-driven Meta-graph Prompter for LLMs in Low-resource Unsupervised Neural Machine Translationby Shilong Pan, Zhiliang…

July 13, 2025

Designing Heterogeneous LLM Agents for Financial Sentiment Analysisby Frank XingFirst submitted to arxiv on: 11…

July 13, 2025

Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languagesby Zhuoyuan Mao,…

July 13, 2025

Bootstrapping LLM-based Task-Oriented Dialogue Agents via Self-Talkby Dennis Ulmer, Elman Mansimov, Kaixiang Lin, Justin Sun,…