Visual programming language Visual Language Examples

SparseVLM: Visual Token Sparsification for Efficient Vision-Language Model Inference

In vision-language models (VLMs), visual tokens usually consume a significant amount of computational overhead, despite their sparser information density compared to text tokens. To address this, ...

IEEE

Evaluation of Visual Adversarial Robustness on Multilingual Large Vision-Language Model

Abstract: Vision-language models (VLM) can solve complex tasks such as visual question answering by integrating visual and linguistic information. Their performance have improved significantly with ...

GitHub

Visual Perception by Large Language Model's Weights

1 University of Science and Technology of China 2 WeChat, Tencent Inc. 1. A Novel Parameter Space Alignment Paradigm Recent MLLMs follow an input space alignment paradigm that aligns visual features ...

IEEE

Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models

Abstract: Visual target navigation is a critical capability for autonomous robots operating in unknown environments, particularly in human-robot interaction scenarios. While classical and ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results