Artificial intelligence – Page 906 – GrooveSquid.com

Loading Now

July 13, 2025

Summary of Uncovering the Text Embedding in Text-to-image Diffusion Models, by Hu Yu et al.

Uncovering the Text Embedding in Text-to-Image Diffusion Modelsby Hu Yu, Hao Luo, Fan Wang, Feng…

July 13, 2025

Summary of Direct Preference Optimization Of Video Large Multimodal Models From Language Model Reward, by Ruohong Zhang et al.

Direct Preference Optimization of Video Large Multimodal Models from Language Model Rewardby Ruohong Zhang, Liangke…

July 13, 2025

Summary of Fables: Evaluating Faithfulness and Content Selection in Book-length Summarization, by Yekyung Kim et al.

FABLES: Evaluating faithfulness and content selection in book-length summarizationby Yekyung Kim, Yapei Chang, Marzena Karpinska,…

July 13, 2025

Summary of Isobench: Benchmarking Multimodal Foundation Models on Isomorphic Representations, by Deqing Fu et al.

IsoBench: Benchmarking Multimodal Foundation Models on Isomorphic Representationsby Deqing Fu, Ruohao Guo, Ghazal Khalighinejad, Ollie…

July 13, 2025

Summary of A Review Of Multi-modal Large Language and Vision Models, by Kilian Carolan and Laura Fennelly and Alan F. Smeaton

A Review of Multi-Modal Large Language and Vision Modelsby Kilian Carolan, Laura Fennelly, Alan F.…

July 13, 2025

Summary of Towards Safety and Helpfulness Balanced Responses Via Controllable Large Language Models, by Yi-lin Tuan et al.

Towards Safety and Helpfulness Balanced Responses via Controllable Large Language Modelsby Yi-Lin Tuan, Xilun Chen,…

July 13, 2025

Summary of Llava-gemma: Accelerating Multimodal Foundation Models with a Compact Language Model, by Musashi Hinck et al.

LLaVA-Gemma: Accelerating Multimodal Foundation Models with a Compact Language Modelby Musashi Hinck, Matthew L. Olson,…

July 13, 2025

Summary of Humane Speech Synthesis Through Zero-shot Emotion and Disfluency Generation, by Rohan Chaudhury et al.

Humane Speech Synthesis through Zero-Shot Emotion and Disfluency Generationby Rohan Chaudhury, Mihir Godbole, Aakash Garg,…

July 13, 2025

Summary of Diffagent: Fast and Accurate Text-to-image Api Selection with Large Language Model, by Lirui Zhao et al.

DiffAgent: Fast and Accurate Text-to-Image API Selection with Large Language Modelby Lirui Zhao, Yue Yang,…