Qwen3-Coder-Flash是阿里巴巴通义千问团队于2025年8月推出的开源编程大模型,属于Qwen3-Coder系列的高效版本。该模型采用Mixture of Experts(MoE)架构,总参数量30.5B,激活参数3.3B,通过128个专家中动态调用8个协同工作,实现了计算效率与性能的平衡。
模型基于因果语言模型(CLM)架构,专注于编程领域的预训练和后训练,具备卓越的代理式编程能力。其核心技术亮点包括:支持最长100万tokens的上下文长度(原生262K),采用YaRN扩展技术;在Agentic Coding、浏览器智能操作和工具调用等场景刷新SOTA记录;通过强化学习实现多轮交互与自主决策,显著提升代码执行成功率。