编码模型
语言模型
256K
| 版本名称: | Qwen3-Coder-Flash |
| 所属模型: | 通义千问 |
| 所属公司: | 阿里巴巴 |
| 发布时间: | 2025年8月4日 |
| 最新版本: | Qwen3-Coder-30B-A3B-Instruct |
| 参数规模: | 30.5B |
| 上下文长度: | 256K |
| 支持语言: | 中文,英文 |
| 授权协议: | Apache 2.0 |
| 体验方式: | https://modelscope.cn/models/qwen/Qwen3-Coder-Flash |
Qwen3-Coder-Flash是阿里巴巴通义千问团队于2025年8月推出的开源编程大模型,属于Qwen3-Coder系列的高效版本。该模型采用Mixture of Experts(MoE)架构,总参数量30.5B,激活参数3.3B,通过128个专家中动态调用8个协同工作,实现了计算效率与性能的平衡。
模型基于因果语言模型(CLM)架构,专注于编程领域的预训练和后训练,具备卓越的代理式编程能力。其核心技术亮点包括:支持最长100万tokens的上下文长度(原生262K),采用YaRN扩展技术;在Agentic Coding、浏览器智能操作和工具调用等场景刷新SOTA记录;通过强化学习实现多轮交互与自主决策,显著提升代码执行成功率。
关注公众号
立刻获取最新消息及人工咨询