Claude Opus 4.8
语言模型
推理模型
编码模型
1024K
版本名称:Claude Opus 4.8
所属模型:Claude
所属公司:Anthropic
发布时间:2026年5月28日
最新版本:4.8
参数规模:未知
上下文长度:1024K
支持语言:中文,英文,日文,法文,德文,西班牙文
授权协议:商业授权
体验方式:https://claude.ai

简介

Claude Opus 4.8 是 Anthropic 于2026年5月28日发布的旗舰大语言模型,基于 Opus 4.7 进行能力与推理行为升级。新版本聚焦提升智能体编程、多领域推理与知识工作能力,在保持定价不变的前提下实现性能优化与成本下降。

技术原理

Opus 4.8 基于 Opus 4.7 进行重点优化,核心改进包括:显著降低代码缺陷隐瞒概率(降至前代的约1/4),主动标注不确定性、减少无依据结论输出,在复杂多步骤任务中判断更稳定,具备主动提问、自我纠错及对不合理计划提出异议的能力。模型新增 Effort Controls(思考强度控制)功能,用户可自主平衡响应速度与输出质量,默认 high 档位。同时支持 Dynamic Workflows(动态工作流),可自动规划任务并调度数百个并行子智能体处理大规模工程任务。

发展历程

Anthropic 于2025年推出 Claude Opus 系列旗舰模型,先后迭代至 Opus 4.5、4.6、4.7。2026年5月28日,Opus 4.8 正式发布,距 Opus 4.7 仅间隔41天,是 Claude 系列史上最快的一次大版本迭代。同日 Anthropic 宣布完成650亿美元H轮融资,投后估值达9650亿美元。

基准测试表现

SWE-Bench Pro 69.2%(+4.9% vs Opus 4.7),Terminal-Bench 2.1 74.2%(+8.4%),OSWorld-Verified 83.4%,GDPval-AA 1890 Elo(+121 vs GPT-5.5)。在至少12项基准测试中击败 GPT-5.5,仅 Terminal-Bench 2.1 略低于 GPT-5.5。

应用趋势

Opus 4.8 更强调 Token 效率与可靠性,运行成本约降低61%,Fast Mode 成本降至前代1/3。适合大型代码仓库开发与维护、长时间无人值守运行的智能体任务、需要模型主动发现并纠正自身错误的工作、计算机操作类任务等场景。

应用

Claude Opus 4.8 广泛应用于以下场景:

软件开发

大型代码仓库开发与维护、代码审查与缺陷检测、跨文件重构与迁移,Dynamic Workflows 支持数十万行代码级别的全代码库迁移,自动跑完测试套件再合并。

智能体任务

长时间无人值守运行的 Agent 工作流、多步骤复杂任务自主执行、计算机操作(Computer Use)自动化,OSWorld-Verified 得分83.4%,Online-Mind2Web 得分84%。

金融与法律

Databricks Genie 数据智能体中处理深层多步骤问题时 token 成本比 Opus 4.7 便宜61%;Harvey 法律智能体基准测试中创下有史以来最高分,首个在全通过标准下突破10%的模型;Hebbia 金融文档工作流中引用精度和检索 token 效率显著提升。

企业知识工作

专业文档分析、PDF与图表处理、复杂推理与知识检索,模型更主动标注不确定性,减少无依据断言,提升企业生产环境中的可信度。

以上信息来自企数智AI小编,如有错误可反馈给我们
30
热度
人工导购
咨询服务