
特斯拉 Optimus,并不是全尺寸人形机器人的最优解
在如今的具身智能行业里,大脑、小脑、硬件、数据被普遍认为撑起产业的四根支柱。
无疑,今年的聚光灯格外偏爱数据和大脑。
随着模型迭代加速,如何构建数据闭环、如何跑通数据飞轮成了绝对的 C 位话题。
相比之下,处于底层支撑的硬件,讨论度冷清了许多,甚至在不少人眼里,硬件已经准备就绪,就等一颗足够好用的大脑。
的确大脑很重要。但是,硬件真的不重要了吗?
今年密集发布的整机新品,给了这种重软轻硬的观念一记强有力的回击。
即便宇树 G1 作为去年的超级单品已经大热,今年各大厂商依然没有停下卷新整机的脚步。
从年初的智元远征 A3,到随后的超维动力 KAI、星海图的 Kengo,再到逐际动力的 LUNA,一批全新的双足人形机器人新品扎堆亮相。
这帮玩家也在向行业传递一个信号,本体设计需要重新审视,硬件不只是模型的容器,它本身就是决定数据质量和迭代上限的护城河之一。
没有成熟的硬件载体,再先进的大脑算法与数据模型也都无从落地。
再看今年发布的这几款新品会发现一个明显的形态分野。
除了星海图的 Kengo 身高 1.4 米,属于中尺寸机器人,智元、超维动力、逐际动力等大多数玩家,都不约而同地选择了全尺寸(1.6 米以上)。
当我们将视野扩大到整个行业,打造一台全尺寸人形机器人也是多数主流玩家的共同选择。
这背后是行业在长期工程迭代、场景试错、技术取舍后沉淀出的共识:机器人要进入为人类设计的世界,就必须在物理尺度上与人对齐。
1、全尺寸人形机器人,该遵循什么设计逻辑
一台全尺寸人形机器人到底该遵循怎样的设计逻辑?
这个看似简单的问题,其实涉及多个层面的系统工程考量。
从环境适配角度看,机器人要进入的世界,本来就是按照人来设计的。
门把手、台面高度、货架层距、楼梯坡度、工具尺寸,绝大多数日常与工业空间都不是为机器单独重做的,而是默认人类在其中活动。
换句话说,人形机器人要做的,不是把世界重新改造成机器世界,而是尽量沿着人类世界的尺度去适配。
因此,全尺寸的第一要义,就是确保机器人的操作空间与人类的活动空间完全重合。
从人机交互来看,机器人越能以人类可理解的方式呈现姿态、手势、表情和动作,越容易在交流、信任和协作上获得优势。
对于全尺寸人形机器人来说,关键也不只是像不像人,而是它能不能在视线高度、动作节奏、身体比例和交互姿态上,让人不用重新学习怎么和它打交道。
它站在哪里、头部怎么布置、手臂如何覆盖工作空间、腰部和髋部能做到什么动作,这些都不是外观问题,而是直接决定它能不能进入家庭、工厂和公共空间的工程问题。
除此之外,尺寸设计也影响着机器人的稳定性、能耗和可控性。
对双足机器人来说,零力矩点、质心高度、支撑多边形这些指标,都会随着身高和肢体比例变化而变化。
把机器人做得更高,腿部驱动、关节扭矩和整体能耗都会跟着上去;做得太矮,又会牺牲越障能力、操作半径和人与机器之间的自然比例。
毕竟,双足行走不是单看站得住,而是要把动态稳定和控制可行性一起算进去。
所以,全尺寸路线真正考验的,不是某一个参数,而是整机在稳定性、能耗、动作范围、任务覆盖度之间能不能找到一个均衡点
从数据利用的角度来讲,全尺寸设计也更利于减少尺寸迁移带来的仿真到现实鸿沟。
今天的人形机器人并不是从零开始学人怎么走路、怎么伸手、怎么转身的,背后大量依赖人体动作捕捉、骨骼模型和运动学重定向。
如果机器人本体的比例、关节布局和人体结构差得太远,动作数据就会被迫做大量重映射,训练效率和落地效率都会被拉低。
所以,全尺寸人形机器人真正的价值,不只是更像人,而是它更容易把人类已有的数据、动作库和交互经验,直接转化成机器人可执行的能力。
这也是为什么在今天的行业里,全尺寸已经逐渐不只是一个尺寸选择,而是一种面向真实世界的系统设计思路。
2、全尺寸人形机器人,开始走向三种价值兑现路径
当全尺寸成为行业共识,真正的差异就体现在选择的道路上。
不同公司对这台机器人到底要干什么的答案大相径庭。
第一条路径最为激进,也最为接近人们对人形机器人的终极想象,直指家庭。代表机器人是 Figure AI 的 F.03 和超维动力的 KAI。
Figure AI 从创立之初就把家庭服务作为终极场景,其今年推出的 Demo 视频也一直围绕厨房、客厅、房间这类家庭有高频需求场景。
今年年初,Figure 更新的机器人大脑 Helix 02,在原先快慢脑的分层架构上,新增了 system0,提升的就是机器人的全身整体控制能力。
超维动力 KAI 同样把家庭陪伴与服务作为核心定位,与 Figure AI 一样,超维动力也是一家典型的全栈式公司。
他们之前推出的 SMASH 系统,是全球首个可室外自主感知的人形机器人乒乓系统,也重点突出了他们的全身运控能力。发布会上,KAI 也发布了他们的世界模型,但是更多细节还没公布。
都是全栈公司、都瞄准家庭场景,但是 KAI 与 Figure 也有着不少的差异。
这个差异体现在KAI更想先弄本体,再基于这个本体去训练模型、采集数据。在本体上,KAI全身 115 个自由度、全身 80% 触觉皮肤的覆盖、36 个自由度的灵巧手,这些硬件层面的设计都是为了减少人机交互的距离感。
值得一提的是,115 个自由度是目前全球已落地的人形机器人中自由度最高的,这意味着 KAIBot 更靠近人体的真实情况。
这样的好处在于,基于 1:1 等比例人体的机器人去训练算法,机器人更拟人、更容易进入真实世界。
第二条路径更加务实且见效更快,那就是工业落地优先。星动纪元的 L7 和乐聚机器人的 Kuavo 5 是这条路的典型代表,收集特定场景的 Know-how,并让机器人先实干起来。
星动 L7 身高 171 厘米,双臂负载 20kg,自研关节模组峰值扭矩达到 400Nm。
L7 既能做整活跳舞,又能在产线里干活,目前已经在顺丰、邮政的物流场景中完成包裹分拣任务。
乐聚 KUAVO5 最大负载 20 公斤,可在零下 20 摄氏度的极寒环境、密集人流等严苛场景中稳定运行。
同时,这两款机器人在实际应用中也可以选择半人形的形态应用。
这两款机器人更看重负载能力、重复定位精度、抗疲劳性和环境适应性,因为工厂和仓库的需求清晰且直接,营收路径也更为明确。
第三条路径则是追求生态化叙事。特斯拉 Optimus 和智元远征 A3 各自代表了一种用生态撬动全局的思维。
特斯拉将 Optimus 定位为现有能源、汽车以及 AI 业务的最后一块拼图。
在汽车业务提供的巨大现金流和制造能力的加持下,Optimus 率先在内部工厂自产自用,以应用拉动研发的方式快速迭代,再逐步走向更广阔的家庭市场。
其优势不仅在于软硬一体的研发效率,更在于用大规模的工业部署来验证技术和降低单台成本,最终实现马斯克所说的比汽车更便宜。
而智元远征 A3 选择的是一条不同却同样聪明的路径:以科研和教育市场为切入点,对标宇树 G1,希望成为高校和实验室的新一代标准研究平台。
远征 A3 身材比例按照真实人体比例设计,配备 1:1 还原人体结构的全自由度柔性腰部,支持大幅扭转与极限动态控制。
通过向科研机构提供开放的算法平台和硬件平台,智元可以收集海量的场景数据和算法反馈,进而反哺后续的产品迭代,实现以平台建生态,以生态促迭代的增长闭环。
三条路径各有侧重,并没有完全的高下之分。
工业路线赚的是当下的实际需求,家庭路线赌的是未来价值,生态路线玩的是长线布局。
但无论选择哪条路,如果最终想真正进入人类的生活空间,尤其是家庭,所有玩家都需要回答同一个更加本质的问题:仅仅像人,真的够吗?
3、尺寸之外,拟人化深度才是真正的护城河
对于上面的问题,答案显然是否定的。
当全行业的主流产品统一卡在全尺寸的基准上,硬件外形的同质化难以避免,未来赛道分层的核心分水岭,会落在拟人化深度上。
而具体的考验会体现在人体比例复刻、整机自由度配置、全身触觉感知、外观人文设计和数据闭环迭代五个维度上。
想要做出持续能用、好用的人形机器人,先得把人体比例学到位。
现在虽然有一部分机型的身高在 1.6 米以上,但有些只是满足参数,四肢、躯干还是按工业机械结构来设计,比例不完全像真人。
这种做法直接导致动作数据没法正常套用,仿真里练得再好,真机运行也会动作变形。这类机器人只能做固定的标准动作,面对家庭这种复杂场景难以应付。
而星动纪元 L7、超维动力 KAI 这类产品,同样是 1.73 米身高,它们选择严格参照亚洲成年人的骨骼数据设计肢体比例,头身比、肩腰尺寸都贴近真人,从硬件上保证了动作数据能顺畅迁移使用。
关节自由度的数量和布局,决定了机器人能不能做出细腻的小动作。
目前,行业量产的人形机器人整机自由度大多在 41-60 个。
超维动力 KAI 选择另辟蹊径,在 1.73 米的机身里布置了 115 个全身自由度,肩颈、腰椎、手腕这些常被简化的部位都做了冗余设计,完整复刻人体活动范围。
从学界共识来看,自由度提高到 115 个,意味着控制算法要解决的数学计算量呈指数级暴增。
如何让 115 个电机实时、不卡顿地协同工作,对中央处理器和 AI 算法是极大的考验。
超维动力正是目前全球范围内,率先在这个超高自由度硬件平台上引领具身大小脑发展的公司,这也是它主打家庭场景的核心优势。
如果想让机器人安心走进家庭,那么触觉感知是安全底线。
这也是缓解恐怖谷效应的一类方法,有了灵敏的触觉,机器人能精准控制力度,避免碰伤人、打碎物品。
目前多数机器人只在指尖装了传感器,身体其他部位完全没有感知能力。
超维动力 KAI 搭载了全身分布式电子皮肤,拥有 18000 个独立触觉点,感知精度达到 0.1N,和人手触感接近。
抓鸡蛋、玻璃杯时能实时调整握力,碰到人也会立刻收力,彻底解决了居家近距离互动的安全问题。
外观设计同样影响人机相处体验。裸露的机械金属会天然带有距离感,而柔软的织物外壳能弱化机械的冰冷感,拉近心理距离。
从先前 1X 的 NEO,到现在 F.03、KAI 都全面采用织物包覆,不难看出,家用机器人做拟人化外观已经是一种行业风向。
高拟人化硬件还有一个被低估的优势,它和数据采集之间形成了正向循环。
高度仿生的机身搭配动作采集设备,可以直接录制真人居家行为数据,不用额外换算就能拿去训练 AI。
硬件越贴近人体,数据利用率就越高,机器人动作也越自然;落地使用后产生的新数据,又能反过来优化算法。
这样一来,就会形成一个高拟人化硬件→高效率数据迁移→更自然行为表现→更多真实交互数据的闭环。
而纵观整个行业,两种路线分野的趋势已经逐渐清晰。
路线 A 以工业效率优先,将拟人化视作一个可选模块,先把机器人的力量、速度和重复精度拉到极值,优先解决工厂、仓库等结构化场景中的刚需问题。
路线 B 则以拟人化先行,先构建与人类高度一致的硬件基座,再逐步发展人工智能和场景泛化能力。
家庭场景属于典型的非结构化交互场景,环境不确定、任务不固定、交互对象复杂多元,只有当硬件足够像人,上层智能才有发挥的空间。
从这个角度看,路线 B 虽然在短期内看似不如工业路线那样能够快速产生营收和规模效应,但它押注的恰恰是全尺寸人形机器人最稀缺的东西:一副足够像人的身体,以及一个足够灵敏的感知网。
全尺寸是行业给出的一个共识选择,但这个共识背后的意义远不止于尺寸、参数本身,它是工程理性与场景需求的共同选择。
而当所有顶尖团队都在同一条起跑线上起步时,真正的竞争才刚刚开始。
从尺寸到形态、从自由度到触觉、从感知到交互,那些选择在拟人化深度上走得更远、更慢、更深的企业,会在回答家庭服务这个终极命题的时候拥有难以复制的护城河。
归根结底,人形机器人作为人类给自己造出的另一种身体,它的最终形态应该看的是它够不够像人。
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。


