Doubao-Seed-Code是字节跳动火山引擎推出的首款专为Agentic编程任务深度优化的编程大模型。该模型采用大规模Agent强化学习训练系统,基于覆盖10万容器镜像的训练数据集,在端到端沙盒环境中进行评测,具备万级并发沙盒session能力和千卡GPU集群并行训练能力。
模型通过纯强化学习训练路径实现SOTA级别性能,无需蒸馏或标注的冷启动数据,在SWE-Bench-Verified官方榜单中刷新了最佳成绩,展现出强大的泛化能力和真实软件工程场景下的潜力。
关注公众号
立刻获取最新消息及人工咨询