编码模型
推理模型
语言模型
128K
| 版本名称: | Qwen3-Coder-Next |
| 所属模型: | Qwen |
| 所属公司: | 阿里巴巴 |
| 发布时间: | 2026年2月4日 |
| 最新版本: | Qwen3-Coder-Next |
| 参数规模: | 800亿 |
| 上下文长度: | 128K |
| 支持语言: | 中文,英文,多编程语言 |
| 授权协议: | 开源协议 |
| 体验方式: | https://modelscope.cn/models |
Qwen3-Coder-Next是阿里巴巴千问团队推出的专为编程智能体设计的开源语言模型。该模型基于Qwen3-Next-80B-A3B-Base构建,采用创新的混合注意力与MoE(混合专家)架构,总参数量达800亿,但每次推理仅激活30亿参数,大幅降低了计算资源需求。
模型通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,能够直接从环境反馈中学习,具备长程推理、工具使用和从执行失败中恢复等核心能力。训练过程包括持续预训练、监督微调、领域专家训练和知识蒸馏等多个环节。
关注公众号
立刻获取最新消息及人工咨询