商业洞察
【特斯拉】去年人人谈论ChatGPT 今年人形机器人迅速火热 -像人样-才是最佳路径?
【查看信息来源】 7-6 4:35:44从北门进入世博展览馆,一排由人形 机器人 组成的“十八罗汉”几乎被观众围得风雨不透。不仅如此,本届大会还有 特斯拉 Optimus-Gen 2(擎天柱二代)、全尺寸开源通用的“青龙”等人形 机器人 国内首秀首发,受到多方关注。
去年大会上,似乎人人都在谈论ChatGPT,而今年,人形 机器人 的热度已经不输通用大模型。在首日的人形 机器人 主题论坛上,甚至有企业家表示,“具身智能才是实现AGI(通用 人工智能 )的最有效途径,OpenAI的大方向大概率是错的”。
人形 机器人 赛道,正在迎来产业化“蝶变”的关键时刻。
擎天柱二代2025年量产目标
像为国内企业定了个倒计时
提出“具身智能是实现AGI的最有效途径”观点的是宇树科技总裁王兴兴。王兴兴是90后,2016年开办宇树科技。几年时间里,宇树科技的员工从3人一路发展壮大到500人,连续拿下红杉中国、德迅投资等知名 创投 基金的投资,今年年初还完成了10亿元的B2轮融资。
“快”是这家企业发展的关键字。就在今年5月份,宇树科技发布了其最新的人形 机器人 产品——Unitree G1,市场售价仅9.9万元起,这让宇树科技一下子成为 机器人 市场的焦点。
9.9万元是啥概念?目前 特斯拉 公开的人形 机器人 Optimus-Gen 2,预计成本价在1万美元左右,市场售价在2万美元左右,9.9万元可以说是一个非常“接地气”的价钱。展会现场,职员向记者表示,目前他们已经收到了很多这款 机器人 的全球订单。
不过,宇树科技目前发布的人形 机器人 并没有搭载大模型“大脑”,这是其与 特斯拉 Optimus-Gen 2的最大区别。业界通常将前者归类于一代人形 机器人 ,将后者归类为二代人形 机器人 。目前,宇树科技将AI大模型运用在了其技术更成熟的四足 机器人 上。
特斯拉 的Optimus仍然是业界的风向标。在本次世界 人工智能 大会上, 特斯拉 Optimus-Gen 2在上海第壹次亮相,吸引了大批观众。
此次 特斯拉 造成的Optimus-Gen 2人形 机器人 为静态模型机。现场有业内人士表示, 特斯拉 从未将原型机在线下展出可能出于两个因素:一是人形 机器人 仍在训练的进程中,产品功能还有待完善,二是为防止 机器人 被拆机或商业信息泄露,上市前不会让外界接触其原型机。
甭管是出于哪一种考虑,在官方口径里, 特斯拉 的这款 机器人 都会在2025年年底前量产上市,届时将有超过1000个Optimus-Gen 2被投放到 特斯拉 工厂。
这似乎像一个倒计时,不断地提醒着国内企业,人形 机器人 的产业化迫在眉睫。现场多家人形 机器人 企业的职员对记者说,当前国内做人形 机器人 的企业越来越多,他们预计国产AI人形 机器人 商业落地需要3到5年。
青龙从开发到发布只花6个月
产业基础好让“高集成”能速成
回到开头的说法,人形 机器人 正在打破国内 人工智能 产业对ChatGPT的迷信,其背后原因也有一些中国特色。
本次世界 人工智能 大会上,另一款大热人形 机器人 ——青龙,由国家地方共建人形 机器人 创新中心(以下简称“国地中心”)研发。国地中心技术责任人邢伯阳对记者说,从开发到发布这款人形 机器人 ,只花了6个月的时间。
人形 机器人 是集成度极高的产品,国地中心为啥能这么快完成?这与长三角的 机器人 产业基础有很大关系。
据介绍,青龙人形 机器人 的很多零部件都是长三角制造,其安置的“大脑”——朱雀,也是由 科大讯飞 星火大模型和书生·浦语大模型支持。
在青龙人形 机器人 展台,业内人士对记者表示,国内工业自动化产业发展得早,近两年大模型又发展势头迅猛,基础良好。“上海有上海 人工智能 实验室,还有这么多互联网企业,要想实现AI+人形 机器人 其实很快”。
中国有做 机器人 的条件,通过具身智能有可能更快地让 人工智能 实现产业落地、商业闭环,这是人形 机器人 赛道愈发火爆的关键原因。另一边,以ChatGPT为代表的大语言模型已经爆火近两年时间,产业化的问题在逐渐袒露,这也是更多人将眼光投向人形 机器人 赛道的主要原因。
王兴兴在大会论坛上表示,“大模型对平面数据的领会做得非常好了,但对时间、空间的领会还远远不够。”他认为,世界模型+具身智能才是通向AGI的最佳路径——现今全球卓越的科学家都在推动世界模型的构建,让 机器人 真正理解整个世界,进入工厂、家庭这样的场景帮人类完成劳动。
卡点在获取规模化数据“练脑”
合成数据和数据开源是两条路
一条赛道迅速火热,一定随同着浮躁。
邢伯阳表示,人形 机器人 商业化现状有点混乱:有解决方案提供商专门卖控制算法,60万元就能让人形 机器人 动起来。但这种一代人形 机器人 的实际应用非常有限,要想实现广泛的商业应用,还是要让AI赋能人形 机器人 。
但AI赋能还面临着很多挑战。大模型植入 机器人 不难,要想适配应用场景却极为不容易。目前市场上开发的二代 机器人 大多采用“大脑+小脑”的AI赋能模式。好比青龙,就配置了“朱雀”多模态大模型作为“大脑”,用于接收外界信息和任务决策;“玄武”模型作为“小脑”,用于控制 机器人 运动轨迹、具体任务执行。
“大脑”模型,即多模态大模型,这在现今国内市场有许多选择。但“小脑”模型需要各个开发机构各自构建,并且进行专门化的动作训练,才能适配特定应用场景。在训练“小脑”的进程中,最难的是数据积累。邢伯阳认为,人形 机器人 规模化数据是整个行业目前最大的槽点。现在人形 机器人 开发机构使用的数据,一是来源于国外的开源数据,另一是来源于开发者自己收集的数据。自采数据成本很高,企业需要使用大量人力重复工作。
北京大学助理教授、北大—银河具身智能联合实验室主任王鹤在前述论坛中提到,在 特斯拉 的公开信息中,为训练Optimus-Gen 2放置电池到红盒子里这一动作, 特斯拉 就出动了40人的数据收集团队,这样高成本的数据收集方式对商业转化是非常不友好的。
为了解决规模化数据的槽点,业界也做了很多尝试。王鹤认为,合成数据可能是获取大体量数据的关键技术。还有机构则在推动数据开源,通过共享来降低数据获取成本。
在本届世界 人工智能 大会上,国地中心除了发布青龙人形 机器人 ,还推出了OpenLoong开源社区,有望聚集更多应用单位、人形 机器人 整机制造商和核心部件的上下游企业,加速技术创新和产业应用。