| 版本名称: | GPT-5.5 |
| 所属模型: | GPT |
| 所属公司: | OpenAI |
| 发布时间: | 2026年4月23日 |
| 最新版本: | 5.5 |
| 参数规模: | 未公开 |
| 上下文长度: | 1050K |
| 支持语言: | 中文,英文,日文,法文,德文,西班牙文 |
| 授权协议: | 商业授权 |
| 体验方式: | https://chat.openai.com |
GPT-5.5是OpenAI于2026年4月23日发布的新一代旗舰模型,内部代号"Spud",是自GPT-4.5以来首个从零完整重训的基础模型。该模型专为复杂现实工作设计,包括编写代码、在线研究、信息分析、创建文档和跨工具操作等任务。
GPT-5.5的核心优势在于Agent(智能体)能力,用户无需精细管理每一步,只需下达模糊的多部分任务,模型即可自主规划、调用工具、检查结果并持续推进直至完成。模型在性能大幅提升的同时,保持了与GPT-5.4相同的Token延迟,完成了性能和速度的完美并存。
GPT-5.5支持100万Token的超长上下文窗口(922K输入,128K输出),在MRCR v2长文本信息检索测试中,512K到1M token区间的得分从36.6%跃升至74.0%,实现了从"名义可用"到"真正可用"的质变。
在Artificial Analysis评测中,GPT-5.5在智能、编码和智能体三大指数上均排名第一:Intelligence Index 60.2、Coding Index 59.1、Agentic Index 74.1。在Terminal-Bench 2.0测试中取得82.7%的准确率,在SWE-Bench Pro中达到58.6%,在Expert-SWE长周期任务中达到73.1%。
GPT-5.5与NVIDIA深度合作,在GB200 NVL72机架级系统上运行,实现了百万Token成本降低至前代的1/35,每兆瓦Token输出量提升50倍。NVIDIA已有超过10000名员工在工程、产品、法务、市场等部门使用Codex + GPT-5.5。
GPT-5.5广泛应用于以下场景:
通过Codex平台实现自主编码、调试、代码审查、多文件代码库管理等。能够管理整个代码仓库并验证自己的bug修复,将原本耗时数天的调试周期缩短至数小时,复杂多文件代码库的实验周期从数周压缩至一夜之间。
OpenAI内部超85%的员工每周跨部门使用搭载GPT-5.5的Codex,财务团队利用其审核了超过7万页税务文件,效率提升显著。支持市场调研、会议纪要整理、财务分析、客服自动化、知识管理等大量重复性任务。
在GeneBench基因数据分析及BixBench生物信息学基准测试中取得领先成绩,甚至协助发现了关于Ramsey Numbers(拉姆齐数)的新证明。支持在线研究、数据分析、跨工具操作等复杂科研任务。
通过Computer Use能力,能够独立操作真实电脑界面,在OSWorld-Verified测试中达到78.7%。支持浏览器交互、文件管理、应用操作等真实工作流自动化。
在CyberGym网络安全测试中达到81.8%,在CTF夺旗挑战中取得88.1%的成绩,可用于安全评估、漏洞检测等网络安全场景。
关注公众号
立刻获取最新消息及人工咨询