GPT-5.5是OpenAI于2026年4月23日发布的新一代旗舰模型,内部代号"Spud",是自GPT-4.5以来首个从零完整重训的基础模型。该模型专为复杂现实工作设计,包括编写代码、在线研究、信息分析、创建文档和跨工具操作等任务。
技术突破
GPT-5.5的核心优势在于Agent(智能体)能力,用户无需精细管理每一步,只需下达模糊的多部分任务,模型即可自主规划、调用工具、检查结果并持续推进直至完成。模型在性能大幅提升的同时,保持了与GPT-5.4相同的Token延迟,完成了性能和速度的完美并存。
长上下文能力
GPT-5.5支持100万Token的超长上下文窗口(922K输入,128K输出),在MRCR v2长文本信息检索测试中,512K到1M token区间的得分从36.6%跃升至74.0%,实现了从"名义可用"到"真正可用"的质变。
性能表现
在Artificial Analysis评测中,GPT-5.5在智能、编码和智能体三大指数上均排名第一:Intelligence Index 60.2、Coding Index 59.1、Agentic Index 74.1。在Terminal-Bench 2.0测试中取得82.7%的准确率,在SWE-Bench Pro中达到58.6%,在Expert-SWE长周期任务中达到73.1%。
合作与部署
GPT-5.5与NVIDIA深度合作,在GB200 NVL72机架级系统上运行,实现了百万Token成本降低至前代的1/35,每兆瓦Token输出量提升50倍。NVIDIA已有超过10000名员工在工程、产品、法务、市场等部门使用Codex + GPT-5.5。