Artificial intelligence – Page 62

July 13, 2025

Multi-level Matching Network for Multimodal Entity Linkingby Zhiwei Hu, Víctor Gutiérrez-Basulto, Ru Li, Jeff Z.…

July 13, 2025

Steganography in Game Actionsby Ching-Chun Chang, Isao EchizenFirst submitted to arxiv on: 11 Dec 2024CategoriesMain:…

July 13, 2025

SweetTok: Semantic-Aware Spatial-Temporal Tokenizer for Compact Video Discretizationby Zhentao Tan, Ben Xue, Jian Jia, Junhao…

July 13, 2025

Unlocking Visual Secrets: Inverting Features with Diffusion Priors for Image Reconstructionby Sai Qian Zhang, Ziyun…

July 13, 2025

Disentanglement and Compositionality of Letter Identity and Letter Position in Variational Auto-Encoder Vision Modelsby Bruno…

July 13, 2025

Geo-LLaVA: A Large Multi-Modal Model for Solving Geometry Math Problems with Meta In-Context Learningby Shihao…

July 13, 2025

FovealNet: Advancing AI-Driven Gaze Tracking Solutions for Optimized Foveated Rendering System Performance in Virtual Realityby…

July 13, 2025

Enriching Multimodal Sentiment Analysis through Textual Emotional Descriptions of Visual-Audio Contentby Sheng Wu, Xiaobao Wang,…

July 13, 2025

Automatic Detection, Positioning and Counting of Grape Bunches Using Robotsby Xumin GaoFirst submitted to arxiv…

July 13, 2025

VCA: Video Curious Agent for Long Video Understandingby Zeyuan Yang, Delin Chen, Xueyang Yu, Maohao…