首页
资讯
GPT
元宇宙
区块链
操作系统
数字产品
供应商
大模型
查产品
查企业
查资料
热门搜索:
数字员工
数字孪生
数字化转型
关注公众号
分类
全部
文本
语言
图像
视频
语音
音频
编码
多模态
推理
排序
向量
行业
其他
上下文
全部
<=8k
<=32k
<=64k
<=128k
>128k
热门
全部
DeepSeek
GPT
Claude
通义千问
GLM
Doubao
元宝
排序
默认
发布时间
热度
通义千问VL-Plus-2025-08-15
图片理解
131K
本模型为qwen-vl-plus的2025年08月15日快照版本。在通用能力上接近Qwen2.5-VL-32B水平;在万物识别和人物识别效果上有提升、在RealWorld场景下的识别准确率提升,幻觉减少。
2025年8月15日
阿里云
通义千问VL-Plus-Latest
图片理解
音频理解
131K
通义千问大规模视觉语言模型。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。本模型是动态更新版本,模型更新不会提前通知。
2025年8月15日
阿里云
通义千问VL-Plus
图片理解
131K
通义千问VL-Plus(qwen-vl-plus),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能。
2025年6月13日
阿里云
通义千问VL-Max-2024-08-09
图片理解
音频理解
33K
通义千问VL-Max-0809(qwen-vl-max-0809),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本次更新上下文支持32k,增强图像理解和视觉推理能力,可以更好地识别图片中的多语言文字和手写体的文字,并集成视觉agent能力,本模型为2024年8月9日的快照版本,期维护到下个快照版本发布时间(待定)后一个月。
2024年8月26日
阿里云
通义千问VL-Max-2024-12-30
图片理解
音频理解
33K
通义千问VL-Max-1230(qwen-vl-max-1230),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本模型为2024年12月30日的快照版本。
2024年12月30日
阿里云
通义千问VL-Max-2024-11-19
图片理解
音频理解
33K
通义千问VL-Max-1119(qwen-vl-max-1119),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本模型为2024年11月19日的快照版本。
2024年11月21日
阿里云
通义千问VL-Max-2024-10-30
图片理解
音频理解
33K
通义千问VL-Max-1030(qwen-vl-max-1030),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本模型为2024年10月30日的快照版本。
2024年11月14日
阿里云
通义千问VL-Max-Latest
图片理解
音频理解
131K
通义千问超大规模视觉语言模型。相比Plus,再次提升视觉推理能力和指令遵循能力,提供更高的视觉感知和认知水平。在更多复杂任务上提供最佳的性能。本模型是动态更新版本,模型更新不会提前通知。
2025年8月13日
阿里云
通义千问VL-Max-2025-04-02
图片理解
音频理解
131K
通义千问VL-Max-2025-04-02(qwen-vl-max-2025-04-02),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本模型为2025年04月02日的快照版本。
2025年4月3日
阿里云
通义千问VL-Max-2025-01-25
图片理解
音频理解
131K
通义千问VL-Max-2025-01-25(qwen-vl-max-2025-01-25),即通义千问大规模视觉语言模型增强版。大幅提升细节识别能力和文字识别能力,支持超百万像素分辨率和任意长宽比规格的图像。在广泛的视觉任务上提供卓越的性能,本模型为2025年01月25日的快照版本。
2025年2月3日
阿里云
通义千问VL-Max-2025-04-08
图片理解
音频理解
131K
数学能力和推理能力有所提升;回复风格面向人类偏好进行调整,模型回复详实程度和格式清晰度明显改善。本模型为2025年4月8日的快照版本。
2025年4月8日
阿里云
通义千问VL-Max-2025-08-13
图片理解
音频理解
131K
视觉理解指标全面提升,数学能力、推理能力、万物识别和人物识别能力有所提升;多语言识别能力增强。本模型为2025年8月13日的快照版本。
2025年8月13日
阿里云
1
……
26
27
28
……
44
资讯
一门“洗稿”生意:AI抄袭“神韵” 爆款文章遭批量魔改
DeepSeek V4大模型被曝春节前后发布:AI编程能力质...
25个火过的国产AI应用,凉了
首销备货 3 万台,豆包 AI 手机要卖给谁?
雷军:未来5年人形机器人将大面积在小米工厂上岗
金融人才培养加速“数字化”转型 第二届全国高校数字...
工信部:“十五五”智能网联新能源汽车产业发展规划将...
蚂蚁开源万亿参数思考模型,综合能力逼近GPT-5
中央网信办、国家发展改革委印发《政务领域人工智...
科技部:正在推动人形机器人在汽车制造、物流搬运、...
人工导购
咨询服务
回顶部
联系我们
关注公众号
立刻获取最新消息及人工咨询