探讨RAG技术、AI代理及AI伦理挑战
WorldArena 世界模型赛道从来都是竞争异常激烈,在经历了前几次比赛过程中的放榜之后,CVPR 2026 WorldArena 世界模型赛道锁定总成绩,智元自研的世界模型 Genie Envisioner-Sim 2.0(以下简称 GE 2.0)拿下了最终的冠军,成为了"强者中的强者"。

WorldArena 是目前世界模型赛道最权威的榜单,拥有最严苛的评测基准,构建了包含 16 项细分核心指标和 3 大真实应用任务的立体评估体系,旨在对具身世界模型的感知精度、物理规律理解、三维空间认知以及动作预测与落地能力进行最严苛的考察。由于其极高的学术严谨性与行业公信力,WorldArena 吸引了全球几乎所有头部世界模型团队同台竞技。
在该赛道评测中,智元团队使用了原生的世界模型 GE 2.0,并未针对赛题进行特殊设计优化,仅基于榜单数据进行了基础微调(Finetune)。"轻装上阵"依然拔得头筹,充分印证了 GE 2.0 强大的通用适配性。

没有针对 WorldArena 进行特别调优,裸考出战依然断层领跑。在 GE 2.0 技术报告中,智元团队对模型进行了全面的能力剖析。相比上一代模型,GE 2.0 不仅在单点性能上实现了跃升,更真正演进为一个全功能、高可用的世界模拟器,构建可试错、可迭代、可进化的虚拟仿真环境,让机器人策略在虚拟场景中自主积累经验、完成动态试错,规避真实场景的试错成本,最终高效迁移至真实物理世界稳定落地,真正实现从"感知预测"到"仿真进化、自主决策"的闭环升级。
功能矩阵全面补齐:GE 2.0 在功能上首次全面覆盖了长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等核心环节,构建了世界模拟器完整的技术能力闭环。

长时序推演能力突破:在长时序推理任务中,GE 2.0 表现出极强的稳定性,画面质量随推理时长的衰减显著弱于行业基线方案。即使在连续推演 40-50 秒的长视频片段时,其生成质量依然超越了基线模型前 10 秒内的表现。

高可靠的闭环评测:作为世界模拟器,核心在于能否真实反映物理世界。团队验证了大量闭环评测结果,证明 GE 2.0 在多项任务上均与真实世界保持着强相关性。这种相关性不止步于宏观统计意义上的"成功率一致",团队还进行了逐案(Case-by-case)的 rollout 结果对比分析,并通过混淆矩阵(Confusion Matrix)提供了严谨的量化佐证,强有力地证明了 GE 2.0 作为策略评测器的可靠性。

打通数据回流反哺机制:在奖励模型(Reward Model)的加持下,GE 2.0 能够对闭环评测的 rollout 过程进行自动化筛选,将世界模型中产出的有效高质量数据精准回流给策略模型(Policy Model)。实验证明,这一机制在多项任务上均助力策略模型实现了显著的性能涨点。

从技术沉淀来看,智元 GE 2.0 的登顶,是长期深耕底层算法、打磨物理 AI 核心能力的必然结果。相较于行业同类模型,该模型实现了全方位技术跃升,不仅补齐长时序稳定推演、多视角精准生成、实时物理还原、闭环奖励判别等全维度能力,更突破传统模型"重视觉、轻物理、难落地"的行业痛点。即便在 40-50 秒超长时序复杂场景推演中,依旧能保持画面稳定、物理逻辑精准、空间结构无偏差,生成数据可直接反哺机器人策略模型迭代,真正实现从"视觉拟真"到"物理可信、可用、可落地"的质变,算法通用性、稳定性、实用性全面领先行业水平。
区别于行业多数聚焦机器人硬件整机、场景应用或单点技术优化的企业,智元坚定锚定具身智能基础模型公司核心定位,核心逻辑不在于制造机器人本体,而在于打造支撑整个物理 AI 行业发展的底层基础设施与通用基础能力。
今年 4 月,智元连续一周进行了"ALL IN AI"智元 AI WEEK 成果发布,完成了开源数据集、开源仿真平台、基座大模型、世界仿真器、机器人部署应用平台五大核心维度的完整技术闭环搭建,构建了行业独一份的"数据筑基—仿真赋能—模型进化—应用落地—生态开放"全链路能力体系。
部署态是今年智元在 2026APC 合作伙伴大会上提出来的概念,智元依托全栈技术闭环,实现机器人在真实复杂场景中大规模稳定作业、持续迭代,具备可落地、可复用特质,真正标志着具身智能从技术演示迈向规模化商用新阶段。
成功实施"部署态"的核心在于底层算法的演进,智元 ALL IN AI 的核心逻辑始终围绕真实物理世界、真实作业需求、真实商用落地,全部服务于机器人规模化部署:真实场景数据集保证模型适配复杂真实环境;生成式仿真大幅降低试错成本;基座模型保障作业精准稳定;世界模型提升复杂任务自主决策能力;零代码平台彻底解决落地难、复制难、迭代难的产业痛点,实现技术价值到产业价值的完整闭环。
一次裸考登顶,是实力的印证;持续全域领跑,是强者的常态。智元本次登顶 WorldArena 世界模型总分冠军,是智元长期坚持 All in AI 战略的成果。算法是未来具身智能产业的竞争核心,只有持续迭代世界模型、基座大模型等核心算法能力,深化虚实融合技术闭环,才能在具身智能这条长跑之路上,不断引领向前。
关注公众号
立刻获取最新消息及人工咨询