
单挑英伟达!具身智能赛道的“中国大脑”世界级领跑
在全球公认的最难作弊的具身智能榜单 RoboArena 上,一家中国公司刚刚击败英伟达和 Pi,拿下第一。
6 月 1 日,在英伟达 GTC Taipei 2026 大会上,黄仁勋重点分享了最新的 NVIDIA Cosmos 3 模型在 RoboArena 等世界级榜单上夺冠的消息。
话音未落,却被一家中国公司反超。
与此同时,这家公司又宣布完成 15 亿元融资。过去三个月,这家公司已经刷新具身智能行业融资速度纪录。
一次技术登顶,一轮资本加注,两个事件拆开看并没有直接联系,合并在一起却透露出具身智能竞争逻辑的转变:资本开始为数据能力定价。
昨天,千寻智能同时放出两大消息:
- 自研的 Spirit V1.6 模型登顶 RoboArena 全球榜首,力压英伟达 Cosmos3、Pi 0.5。
- 完成 15 亿元(约 2 亿美元)A + 轮融资——在雷军、马云之后,迎来一线美元基金以及大型产业投资方重注。
至此,千寻智能在三个月内完成了 4 轮融资,累计吸金近 50 亿元。
1、英伟达点赞过却遭客场单挑、三个月融资 50 亿,资本到底在抢什么?
先说榜单这件事。RoboArena 由加州大学伯克利分校、斯坦福大学、英伟达等机构发起,被认为是「全球最难作弊」具身智能测评榜单。
它由具身公司自己提交模型,经志愿者团队任意选择环境和任务来评估模型能力。
双盲机制保障了参与者无法刷榜或任何作弊行为,完全考验的是模型在真实物理世界的泛化能力,这也是具身智能领域公认含金量最高的世界级主榜单。
目前,千寻智能最新的 Spirit v1.6 超过了英伟达,占据榜首。
在测评过程中,千寻智能 Spirit v1.6 模型在不同任务比拼上,分别超过了英伟达模型(Cosmos3)、Pi 系列(Pi0.5)。
在「打开笔记本」测试中,Spirit v1.6 不仅成功打开笔记本并有完整动作链,而 Cosmos3 和 Pi0.5 完全没有尝试翻开的动作。
按照积分规则,总分每差 100 分实际上代表 2:1 胜率,Spirit v1.6 模型在随机挑选的任务中,以大比分领先了其他对手,并展示了模型在语义理解、动作执行上的稳定性。
实际上,千寻智能具身智能模型的实力早已盛名在外。
今年 1 月,上一代 Spirit v1.5 在第三方机器人模型评测组织 RoboChallenge 的 Table30 榜单上位列第一,超过了之前最强模型 Pi0.5,首次在世界级的模型能力比拼中崭露头角。
Pi 于 2024 年发布的 VLA 路线具身模型,是具身智能最有影响力的里程碑事件。包括千寻智能创始人在内,不少全球科学家正是在那次真正见识到具身智能的潜力,才决定投身这一领域。
然后千寻用了一年多的时间,连续两次超过了 Pi。
今年 Spirit v1.5 赢了 Pi 夺冠时,英伟达具身智能负责人 Jim Fan(范麟熙)在 X 上为千寻智能点赞。
几个月之后,迭代后的 Spirit v1.6 模型也超过了英伟达 Cosmos3,模型能力迭代迅速。
正好在这样的关口,继雷军(顺为)+马云(云锋)入局之后,千寻智能获得了新一轮融资加注。
这一轮千寻获得了约 15 亿元融资,并完成「3 个月内 4 轮获得 50 亿元」融资密度的节奏,目前投资方包括京东、哈勃投资、柏睿资本、红杉中国等头部科技公司与投资机构。
在上一轮融资之后,千寻智能的估值已经突破 200 亿元,进入国内具身玩家第一梯队。如今,千寻智能估值继续放大。
回头来看,自 2025 年下半年以来,具身智能公司资本化全面提速,不少公司拿下了单笔 10 亿元级别的融资,多家估值 100 亿到 200 亿级。
今年战事再度升级,仅仅 4 月,包括千寻智能在内的 8 家头部企业获超 200 亿元融资,被视为「具身智能融资月」。
但同样是融资,千寻的逻辑和其他玩家有一些不一样。
大象研究院发布的《人形机器人行业研究报告》指出:
资本市场对人形机器人的估值逻辑正在重构,从传统的「硬件制造」模式转向「AI SaaS」模式,企业价值不再仅由销量决定,而取决于数据资产的广度和闭环能力。
千寻智能最新的几轮融资,几乎都卡着模型成绩单发布的节点。
这背后反映的,其实是数据资产的价值。而这也是千寻在这一轮「抢筹」大战中跑出来的真正原因。
2、千寻的数据超级工厂,为什么难以复制?
模型性能,能够让资本估值超过 200 个亿,千寻智能的数据底座到底值钱在哪里?
一项关键指标让千寻智能和其他玩家拉开距离——数据。
目前,千寻智能搭建起了一套「工业级数据金字塔」训练体系:
底层依托互联网通用视频做预训练、中层采用可穿戴设备真实交互数据专项迭代、顶层用落地场景真实数据做闭环微调。
千寻智能「工业级数据金字塔」
这个体系是怎么跑通的,值得细说。
千寻智能成立于 2024 年,起初,采用视频数据做预训练+遥操作数据做微调的组合模式。
2024 年到 2025 年上半年,遥操作是主流数据采集方式。
由人类远程操控机器人本体完成具体任务的遥操作能够获得高质量数据样本,但成本高、采集效率低,极少企业能够系统性投入。
人类操作视频更加贴近真实世界,获取难度低,不依赖大量真实机器人,但是视觉信息缺乏动作与物理交互,不足以支撑精细操作。
以 UMI 为代表的可穿戴设备不依赖于机器人本体,又能采集到足够真实的操作数据,具备低成本、便携等规模化潜力,作为折中路线被不少玩家看中。
但是,早期的可穿戴设备方案存在数据维度少、精度低,数据与硬件绑定严重,数据处理流程复杂等难题。
千寻智能将 80% 以上的精力和资源,投在解决数据上,通过持续优化采集设备和数据管线(包括数据切断、标注、质检的整个流程),这一状态持续了近两年,直到 2026 年初完全突破。
目前,千寻智能自研 uDAS 可穿戴数采设备,两年历经 7 代迭代,可实现全身关节、手部力触觉多维度信息同步采集,形成 UMI、外骨骼、动捕多类型融合采集方案。
这一方案将采集成本降至传统遥操作方式 1/10,数据可用性能够达到遥操作数据的 95%。
数据的来源也发生了变化,不再是人为搭建的实验室环境,而是覆盖了工业、书房、客厅、厨房、居家等真实生产生活场景。
这就引出了千寻数据体系里一个反直觉的核心理念:Dirty Data 脏数据。
与其他公司追求「完美数据」不同,千寻放弃了实验室理想化完美数据,以真实环境杂乱、带干扰的原生数据训练模型,以提升真实场景泛化能力。
这里的逻辑很简单:机器人最终要在真实世界干活,不在实验室。
真实环境的杂乱、干扰和实物,恰恰是模型泛化能力的养分。
随着大笔融资源源不断的注入,今年 1 月起,千寻可穿戴设备采集开始铺量,并组建专业数据采集团队,规模超过一千人。
这是国内规模最大的具身数据采集团队之一,在全国多点位布局的分布式采集网络。
100 万小时数据,被行业普遍视为具身模型性能向下一个阶段跃迁的门槛,千寻智能计划在 2026 年全年数据总量达到这一目标。
千寻智能在预训练阶段来自可穿戴设备采集数据,之后用遥操作数据做微调,最后让机器人在真实环境里通过强化学习自主完成任务获得数据,形成组合式的「数据配方」。
这套配方里,最难的是金字塔的顶端:真实场景的数据。
机器人得在真实产线上跑,才能产生这类数据。这也是为什么场景成了核心资源。
千寻智能数据清洗与标注
而为了将收集来的数据高效利用,千寻智能将数据汇入「数据工厂」,并且实现数据实时体系化、平台化运营。
一方面,千寻智能打造了小时级别迭代的数据工厂体系,形成「任务自动派发—实时上传—质检清洗—智能标注—自动化训练」全链路闭环。
千寻智能可穿戴数采设备同时在全国多地进行数据采集
另一方面,通过搭建自研 Spirit AI DASH 数据可视化系统,千寻智能实现全国采集网络、任务结构(时长、任务分布)、设备状态全域可视化实时管控的数据生态。
把这些加在一起:
自研的采集设备、千人规模的采集团队、脏数据训练理念、海量真实数据储备、数据可视化生态平台(小时级迭代的数据工厂、全国分布式采集网络)。
缺任何一环,数据的价值都会快速衰减。
环环相扣的数据利用模式,正是这套体系最难被复制的地方。
至此,在数据能力上,千寻智能跑通了「数据采集—模型迭代」的循环。
这套循环跑起来之后,效果是非常直观的:
此前,受限于模型能力,机器人仅能完成单一场景、单一任务;随着模型能力优化,对于同一模型,只需给出指令,机器人便能在相对开放的场景下完成多项任务。
3、场景是入口,数据才是目的
拉开千寻智能的投资方名单,会发现一个规律:他们不仅是给钱,更是给场景。
纵观千寻智能的融资历程,既有柏睿资本(宁德时代系)、明荟投资(汇川技术家办)、TCL 创投,京东、招商局创投,也有哈勃投资(华为系)、顺为资本(小米系)的投资。
这背后对应的是工业制造、物流零售、消费电子三大核心场景。
为什么这些产业资本愿意投千寻?
因为他们自己也需要机器人,投资是最直接的绑定方式。
他们提供场景,千寻智能机器人在场景里采集数据、跑强化学习,模型越练越强,反过来干更复杂的活。
这是一个真正完成商业化落地的闭环。
2025 年 12 月与宁德时代的正式合作,让千寻智能成为第一个真正能在电池产线上干活的具身公司,在复杂高压环境下实现插接工序 99% 以上的超高作业成功率,单日工作量达到人工 3 倍。
今年 3 月,千寻智能与京东签署战略合作,Moz 机器人接入京东 MALL 智慧零售场景,则实现了从工厂走向商业场景的跨越。
从工厂到商场,两个不同的场景,喂给模型的是不同的数据。
依托 Spirit v1.6 模型能力,千寻智能机器人开始从单一工厂向多场景扩展。
但规模化做好这件事并不容易。
现阶段,人形机器人场景适配占据超过六成的时间,这远多于硬件本体生产、功能开发环节耗费的精力。一个机器人跳舞表演,也得需要算法人员训练一两个月。
不过千寻智能的终极目标不是「秀」,不是「表演」,而是首先在真实产线上干活,利用工厂、仓储里的私有数据,是建立别人进不来的壁垒。
这轮融资,千寻主要用于构筑算法 + 硬件 + 数据三位一体的技术底座。外界可能觉得这个答案不够性感。
但对于正在跑数据飞轮的公司来说,稳固的底座就是一切。
当量产不再是终局时,数据能力的高低才决定了一家具身公司能够走多远。
2026 年,是以数据能力为核心的模型能力的淘汰赛。
具身智能的竞争,已经从机器人转向数据工厂。具身智能已经打响「数据战争」。
在具身智能领域,中国占据人才、数据能力和系统成本上的优势,而中国玩家也真正第一次有能力与全球顶级玩家「并跑」,并同台竞技,一较高下。
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


