多模态模型
图像理解
| 版本名称: | 星火X2-VL |
| 所属模型: | 讯飞星火 |
| 所属公司: | 科大讯飞 |
| 发布时间: | |
| 最新版本: | X2-VL |
| 参数规模: | MoE |
| 上下文长度: | 未知 |
| 支持语言: | 中文,英文 |
| 授权协议: | 未知 |
| 体验方式: | https://xinghuo.xfyun.cn |
星火X2-VL是科大讯飞于2026年6月11日发布的多模态大模型,采用专属MoE架构,以原生多模态范式训练,非文本+视觉拼接方案。模型搭载轻量化视觉编码器,实现快慢思考统一,是唯一基于全国产算力训练的主流大模型(训练平台为无锡太湖星跃平台)。性能方面,高考数学全国I卷得分148分,高中全学科图文试题准确率接近95%,推理准确率较前代提升28.7%。模型体系为“1+2+2”架构:1个多模态底座+2个垂类模型+2个行业模型,同步升级具身智能模型GEAR-VLA。
视觉推理与图文理解:支持复杂图表、文档、试题的多模态理解与推理;文档分析与OCR:高精度文档结构化解析与文字识别;多模态答题:覆盖全学科图文试题,准确率接近95%;具身智能:GEAR-VLA升级,支撑机器人视觉-语言-动作协同;视频理解:支持视频内容分析与理解。
关注公众号
立刻获取最新消息及人工咨询