GPT-5.5
语言模型
推理模型
多模态模型
编码模型
1050K
版本名称:GPT-5.5
所属模型:GPT
所属公司:OpenAI
发布时间:2026年4月23日
最新版本:5.5
参数规模:未公开
上下文长度:1050K
支持语言:中文,英文,日文,法文,德文,西班牙文
授权协议:商业授权
体验方式:https://chat.openai.com

简介

GPT-5.5是OpenAI于2026年4月23日发布的新一代旗舰模型,内部代号"Spud",是自GPT-4.5以来首个从零完整重训的基础模型。该模型专为复杂现实工作设计,包括编写代码、在线研究、信息分析、创建文档和跨工具操作等任务。

技术突破

GPT-5.5的核心优势在于Agent(智能体)能力,用户无需精细管理每一步,只需下达模糊的多部分任务,模型即可自主规划、调用工具、检查结果并持续推进直至完成。模型在性能大幅提升的同时,保持了与GPT-5.4相同的Token延迟,完成了性能和速度的完美并存。

长上下文能力

GPT-5.5支持100万Token的超长上下文窗口(922K输入,128K输出),在MRCR v2长文本信息检索测试中,512K到1M token区间的得分从36.6%跃升至74.0%,实现了从"名义可用"到"真正可用"的质变。

性能表现

在Artificial Analysis评测中,GPT-5.5在智能、编码和智能体三大指数上均排名第一:Intelligence Index 60.2、Coding Index 59.1、Agentic Index 74.1。在Terminal-Bench 2.0测试中取得82.7%的准确率,在SWE-Bench Pro中达到58.6%,在Expert-SWE长周期任务中达到73.1%。

合作与部署

GPT-5.5与NVIDIA深度合作,在GB200 NVL72机架级系统上运行,实现了百万Token成本降低至前代的1/35,每兆瓦Token输出量提升50倍。NVIDIA已有超过10000名员工在工程、产品、法务、市场等部门使用Codex + GPT-5.5。

应用

GPT-5.5广泛应用于以下场景:

编程开发

通过Codex平台实现自主编码、调试、代码审查、多文件代码库管理等。能够管理整个代码仓库并验证自己的bug修复,将原本耗时数天的调试周期缩短至数小时,复杂多文件代码库的实验周期从数周压缩至一夜之间。

企业自动化

OpenAI内部超85%的员工每周跨部门使用搭载GPT-5.5的Codex,财务团队利用其审核了超过7万页税务文件,效率提升显著。支持市场调研、会议纪要整理、财务分析、客服自动化、知识管理等大量重复性任务。

科研与知识工作

在GeneBench基因数据分析及BixBench生物信息学基准测试中取得领先成绩,甚至协助发现了关于Ramsey Numbers(拉姆齐数)的新证明。支持在线研究、数据分析、跨工具操作等复杂科研任务。

计算机操作

通过Computer Use能力,能够独立操作真实电脑界面,在OSWorld-Verified测试中达到78.7%。支持浏览器交互、文件管理、应用操作等真实工作流自动化。

安全与网络

在CyberGym网络安全测试中达到81.8%,在CTF夺旗挑战中取得88.1%的成绩,可用于安全评估、漏洞检测等网络安全场景。

以上信息来自企数智AI小编,如有错误可反馈给我们
19
热度
人工导购
咨询服务