阿里云开源通义千问多模态大模型Qwen-VL

大家好！今天让小编来大家介绍下关于阿里云开源通义千问多模态大模型QwenVL的问题，以下是小编对此问题的归纳整理，让我们一起来看看吧。

阿里云开源通义千问多模态大模型Qwen-VL 第1张

《科创板日报》25日讯，阿里云今日推出大规模视觉语言模型QwenVL，并对其直接开源。QwenVL以通义千问70亿参数模型Qwen7B为基座语言模型研发，支持图文输入。相较于此前的VL模型，QwenVL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力，可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。（记者黄心怡）

来源：财联社

以上就是小编对于阿里云开源通义千问多模态大模型QwenVL问题和相关问题的解答了，阿里云开源通义千问多模态大模型QwenVL的问题希望对你有用！