GLM-4.6V
多模态
图像理解
文本生成
125K
版本名称:GLM-4.6V
所属模型:GLM
所属公司:智谱 AI
发布时间:2025年12月12日
最新版本:GLM-4.6V
参数规模:106B
上下文长度:125K
支持语言:中文,英文
授权协议:MIT
体验方式:https://chat.z.ai/

简介

GLM-4.6V 是智谱 AI 开源的多模态大模型系列,包括面向云端与高性能集群场景的基础版 GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版 GLM-4.6V-Flash(9B)。该模型将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA,首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从“视觉感知”到“可执行行动”的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

应用

GLM-4.6V 适用于智能图文混排与内容创作、识图购物与导购、前端复刻与多轮视觉交互开发以及长上下文的文档与视频理解等任务。具体场景包括富文本内容的理解与创作、可视化网络搜索、前端重构与视觉交互、长上下文多文档理解等。
以上信息来自企数智AI小编,如有错误可反馈给我们
30
热度
人工导购
咨询服务