首页数智产品供应商大模型

国家队出手！北京人形推出全球首个统一具身智能模型

来自：智东西

发布时间：05-17

2026年5月16日，北京人形机器人创新中心推出全球首个按"大一统"思想训练的具身智能模型——Pelican-Unify 1.0。

作为通用具身智能平台"慧思开物"的核心组件，它试图回答一个关键问题：一个真正面向物理世界的智能体，究竟应该如何构建？北京人形给出的答案是，具身智能要走向"理解-推理-想象-行动"闭环智能。

这一思路的威力，在第三方权威评测中得到了验证：Pelican-Unify 1.0在由清华、普林斯顿、北大等八所顶尖机构联合发起的World Arena全球评测中，以66.03的EWM综合得分登顶世界第一。

继旗下WoW具身世界模型登顶World Arena Data Engine（数据引擎）赛道后，北京人形由此成为全球唯一在World Arena两大核心赛道同时夺冠的企业，加冕具身智能领域首个"双冠王"。

一、拿下两榜SOTA，机器人真的会先预演再行动

具身智能模型的难点，在于多种能力能否在同一个物理闭环中相互支撑。

北京人形把Pelican-Unify 1.0放进三个体系中检验：作为视觉语言模型，看它是否真正理解场景和指令；作为视觉运动策略，看它是否能稳定完成机器人动作；作为行动条件世界模型，看它是否能在动作发生前想象未来状态。

结果显示，统一模型并没有因为"大一统"而牺牲单项能力。Pelican-Unify 1.0综合能力大幅超越基座Qwen3-VL-4B-Instruct，理解能力测评分数从58.2分升至64.7分，在空间接地、物理理解类具身基准中提升幅度尤为显著。

该模型视觉运动策略表现出众，通过RoboTwin五十项双臂任务测试，整体成功率达93.5%，多数高难度实操任务完成度极高。

该模型还登顶世界模型测评World Arena榜单，EWM得分66.03位居榜首，3D空间精度与物理运动质量两项核心指标同样领先，充分彰显其出色的空间构建、物理逻辑与行动约束把控能力。

在真实机器人验证中，Pelican-Unify 1.0被部署到UR5e机械臂与天宫人形机器人上，重点测试组合泛化和零样本迁移。

第一个考验是组合泛化。在UR5e上，团队仅用"插入RJ45接头"和"做防水处理"这两个原子任务的训练数据，从未让模型见过两者串联的完整演示。测试时，机器人收到一条自然语言指令："将RJ45线缆插入3号端口并做防水处理"。它必须连续完成A再完成B。传统的VLA基线在此失败，因为它们缺少"A完成后应该发生什么"的表征。而Pelican-Unify 1.0在完成插线后，其想象模块基于当前场景和任务意图，自主"渲染"出下一步防水操作前的未来状态，行动模块随即接续执行。在没有见过任何完整串联示范的情况下，它成功了。这是"先想象，再行动"最直接的证据。

第二个考验是零样本迁移。在天宫人形机器人上，模型仅用5个见过任务加上3个未见任务极少量（每任务50段）的视频序列进行训练。面对全新的场景和任务，它依然能够在人类盲测评估中获得最高分。这充分证明了，一个通过"理解-推理-想象-行动"闭环训练出来的基础模型，其内化的物理常识与任务逻辑，能够支撑其在陌生环境中做出合理行为。