Artificial intelligence – Page 2624

July 13, 2025

Summary of Optimised Grouped-query Attention Mechanism For Transformers, by Yuang Chen et al.

Optimised Grouped-Query Attention Mechanism for Transformersby Yuang Chen, Cheng Zhang, Xitong Gao, Robert D. Mullins,…

July 13, 2025

Summary of Uni-mol2: Exploring Molecular Pretraining Model at Scale, by Xiaohong Ji et al.

Uni-Mol2: Exploring Molecular Pretraining Model at Scaleby Xiaohong Ji, Zhen Wang, Zhifeng Gao, Hang Zheng,…

July 13, 2025

Summary of Hierarchical Thematic Classification Of Major Conference Proceedings, by Arsentii Kuzmin et al.

Hierarchical thematic classification of major conference proceedingsby Arsentii Kuzmin, Alexander Aduenko, Vadim StrijovFirst submitted to…

July 13, 2025

Summary of Differentiable and Learnable Wireless Simulation with Geometric Transformers, by Thomas Hehn et al.

Differentiable and Learnable Wireless Simulation with Geometric Transformersby Thomas Hehn, Markus Peschl, Tribhuvanesh Orekondy, Arash…

July 13, 2025

Summary of Domain Adaptation Of Llama3-70b-instruct Through Continual Pre-training and Model Merging: a Comprehensive Evaluation, by Shamane Siriwardhana et al.

Domain Adaptation of Llama3-70B-Instruct through Continual Pre-Training and Model Merging: A Comprehensive Evaluationby Shamane Siriwardhana,…

July 13, 2025

Summary of Using Neural Networks For Data Cleaning in Weather Datasets, by Jack R. P. Hanslope et al.

Using Neural Networks for Data Cleaning in Weather Datasetsby Jack R. P. Hanslope, Laurence AitchisonFirst…

July 13, 2025

Summary of Sit: Symmetry-invariant Transformers For Generalisation in Reinforcement Learning, by Matthias Weissenbacher et al.

SiT: Symmetry-Invariant Transformers for Generalisation in Reinforcement Learningby Matthias Weissenbacher, Rishabh Agarwal, Yoshinobu KawaharaFirst submitted…

July 13, 2025

Summary of Behaviour Distillation, by Andrei Lupu et al.

Behaviour Distillationby Andrei Lupu, Chris Lu, Jarek Liesen, Robert Tjarko Lange, Jakob FoersterFirst submitted to…

July 13, 2025

Summary of Discovering Common Information in Multi-view Data, by Qi Zhang et al.

Discovering Common Information in Multi-view Databy Qi Zhang, Mingfei Lu, Shujian Yu, Jingmin Xin, Badong…

July 13, 2025

Summary of From Overfitting to Robustness: Quantity, Quality, and Variety Oriented Negative Sample Selection in Graph Contrastive Learning, by Adnan Ali et al.

From Overfitting to Robustness: Quantity, Quality, and Variety Oriented Negative Sample Selection in Graph Contrastive…