11月27日,商汤科技旗下的智能汽车平台商汤绝影举办2024“绝影实力AI DAY”,当日商汤绝影全面展示了「驾-舱-云」三位一体的通用 人工智能 (AGI)产品体系与战略布局,还宣布牵手奇瑞大卓智能、 东风汽车 展开全方位深度战略合作。
自从 特斯拉 在北美推送FSD V12版本后,点燃了大多数中国车企和智驾供货商对端到端大模型的热情。在AI DAY上,商汤绝影也展示了基于J6E、J6M、Orin等不同算力平台缔造的全场景高阶智驾、端到端智驾等绝影量产智驾产品体系。据了解,基于J6平台的智驾方案预计2025年第贰季度将量产交付,而量产端到端智驾方案则预计会在明年年底量产落地。
端到端智驾技术为行业造成了范式革新,逐渐取代模块化的规则,成为智驾技术的进化方向。但随之而来的是对高质量数据的切实需求呈指数级的增长,而高质量数据的关键在于真实。受限于高阶智驾的量产规模、算力资源,目前大多数车企和智驾公司都面临相同的问题,即高质量驾驶数据的获取难度大、效率低、成本高。
“智驾高端局的竞争不只是车端模型的比拼,端到端的决战,战场在云端。”商汤绝影总裁、商汤科技联合开创人、首席科学家王晓刚表示,随着端到端时代的到来,数据成为最核心的竞争力,“谁离数据不久前,谁的数据基础设施最强,谁能把这些数据基础设施铺到主机厂,谁在未来发展和竞争当中就有主动权。”
为此,商汤绝影发布「开悟」世界模型,能够理解真实世界的物理规则、交通规则,生成的视频数据也更加真切。通过多模态大模型,「开悟」世界模型可以支持多样化的自动驾驶场景及Corner case(极端情况)的可控生成。目前商汤绝影基于1024类场景,能够泛化出更多的平行世界,缔造了千万级的生成场景库,预计2025年对行业开放。
世界模型最基础也是最核心的能力是生成高质量视频数据,因此也成为车企占领智驾高地的新风向。今年7月,蔚来在科技日活动上也宣布蔚来世界模型(NWM)正式发布,它能够在100毫秒内推演出216种可能发生的场景,并寻找到最优决策。
但在王晓刚看来,选择全栈自研路线的主机厂可能难以承受基础设施的持续投入,“像大模型,商汤在这方面累计投入超过100个亿,后面还会持续在这方面投入。所以说大家要找到自己的定位,形成比较有效的合作,而不是恶性竞争和取代的关系,这样的话才能够达到共赢共生,长久持续的发展。”
然而All in大模型的商汤科技也面临着巨亏,2018年至2023年,商汤科技的净亏损分别为34.28亿元、49.63亿元、121.6亿元、171.4亿元、60.45亿元和64.4亿元人民币,而以智驾为重点业务的商汤绝影仍然是需要长期烧钱的板块,2024年上半年,绝影智能汽车业务收入为1.68亿元人民币,同比增长100.4%,但目前商汤绝影量产上车的情景要稍显落伍于其它头部Tier 1。
对于盈利预期和合作规划,王晓刚表示,未来自动驾驶实现盈亏平衡还需要有三年左右的时间,这决定于自动驾驶的量,要有足够多的量,百万级的量去支撑业务的发展。“另外,比较关键的是合作的模式,能够以更高性价比的形式去完成交付,实际上还包含新技术和新产品的开发。”
当日,王晓刚就大模型对智驾技术的变革、行业竞争与生态等诸多问题接受了21世纪经济报道在内的媒体采访,以下是采访实录(经摘编):
数据决定主动权
Q:去年智驾圈子里面传出头部四家“地大华魔”这样的说法,这个格局形成背后的深条理起因是啥?商汤绝影在智驾供货商行业里给自己的定位是啥?
王晓刚:过去自动驾驶交付模式还是标准化的交付模式,“地大华魔”有各自的优势和特点,只能说今天当端到端到来的时候,最大的价值就是在于数据。
以前大家关注的是,谁的算法比较先进或有没有芯片,能不能进行垂直的整合,这四家可能或多或少都有类似的特点。可是接着端到端最核心的点,不一定是软硬一体或进行垂直整合,而是数据,谁离数据不久前,谁的数据基础设施最强,谁能把这些数据基础设施铺到主机厂,谁在未来发展和竞争当中就有主动权。今天毕竟还是技术驱动的行业,当技术发生变革的时候,这里面生产力核心要素就会发生变化,这也意味着给市场上竞争的态势造成新的变化。
Q:关于端到端,数据极为重要,可是对于原始数据的积累,因为不会一开始就有许多优质的数据,现在大家又在进行数据的交易,你如何看待数据交易的 势头?
王晓刚:更准确而言,数据其实不是最重要的,而是数据的条件设施和数据管线是最重要的,因为有效的数据是随着算法的变化而变化的,永久不会去存储最原始的数据,因为甭管是通讯,还是存储成本都太高了。那么算法和模型变的时候,提取数据的形式就会发生变化。只要有这样一套有效的数据生产的管线随时随地都能有新的数据高效地引进来。
Q:国内除了自动驾驶供货商,还有主机厂好比蔚小理、小米这些新势力也在投入智驾,绝影如何能够实现突破?
王晓刚:这里面比较关键的是要有一个可持续发展的理论,今天虽然竞争很激烈,实际上智能化、自动驾驶的投入还是巨大的;同时看到一个问题,大家很多是重复性的投入,这就在于基础的设施数据,大家没有进行对齐,今天之所以会出现成本高的问题,在于机制上大家合作的模式。
有些新势力全栈自研,像大模型,商汤在这方面累计投入超过100个亿,后面还会持续在这方面投入,任何一家公司如果在基础设施方面持续投入的话也是难以承受的。这就是为啥说大家要找到自己的定位,形成比较有效的合作,而不是恶性竞争和取代的关系,这样才能够达到共赢共生,长久持续的发展。
Q:现在比较坚定地选择纯视觉方案的,除了Tesla,就是极越跟小鹏,在封闭路段上纯视觉的确是没啥问题的,可是在城区明显还是比有 激光雷达 的差了很多,在你看来,纯视觉和带 激光雷达 的方案今后会是怎样的发展态势?
王晓刚:关于纯视觉和 激光雷达 ,这是由现阶段所积累的数据体量所决定的,视觉我认为还是有更高的天花板,但这里面需要有更多的数据,这也是为啥我们要把基础设施建立好,这样才能够有比较长久的发展。
盈亏平衡还需要三年左右
Q:绝影作为新型Tier-1是怎样与客户研发部门协同的?双方各自的技术界限是啥?具体到本次绝影和大卓的合作,两者是怎样分工的?
王晓刚:以往的是模块化分工,Tier-1负责集成,作为整体黑盒标准化的交付,可是未来在端到端自动驾驶到来的时候,更多是要依赖数据的驱动,数据就在主机厂手里,所以谁能够更接近数据,谁就能够在未来发展过程当中占据主动。
以前模块化的分工,将来就不太存在了,因为端到端一个模型把之前的模块统一在一起,它的协作和分工模式就会发生比较重要的变化。好比我们跟主机厂和自研团队的协同,关键的是我们能够提供基础算力和数据平台化能力,包含工具链,我们要能够去对齐数据生产的标准和算法的架构,如果这些东西对不齐的话,在不同车型上收集的数据是没有办法进行兼容的。
这些东西做好之后,相当于我们给数据石油搭了一个非常坚实的、高质量的数据生产管线,有价值高质量的数据就会从这个“油田”里面源源不断地输出出来,最后为它的产品形成提供很强的动力。
在产品层面,大家采取的模式就是比较灵活的模式,像类似奇瑞这样的主机厂,量产车的数量非常多,每年车型也非常多,整个交付的任务是非常繁重的。这种情景下,如果我们跟主机厂自研团队在数据、工具链、算法架构上对齐以后,当涉及具体交付车型的时候,大家就会比较灵活,有时候你可以多做一点,有时候我来多做一点。
今天我们可以看到智能驾驶整体上离盈利还有相应的距离,说白了,在交付过程当中,如果大家各方面资源和数据工具链没有对齐,往往会造成重复的投入,谁将来能够提升效率,有高性价比的交付,谁就能够走得更远,因此我们跟大卓的合作就是基于这样的认知,也是按这种方式进行推进的。
Q:刚才提到智能驾驶距离盈利还有一段距离,从你的判断,这个距离大概会有多长?绝影在国外市场方面怎么考虑?
王晓刚:未来自动驾驶实现盈亏平衡还需要有三年左右的时间,这里面决定于自动驾驶的量,要有足够多的量,百万级的量去支撑业务的发展。另外,比较关键的是合作的模式,能够以更高性价比的形式去完成交付,实际上还包含新技术和新产品的开发。
另外,海外方面比较关键的是随着中国车企出海,当然我认为座舱可能会走得更快一些,驾驶里面可能还要涉及不同区域适配的工作,这是一个大趋势,国内能够培养出产品的竞争力,将来能够取得盈利,还是希望全球市场上有更多的空间,而且利润空间可能还会更高一些。
Q:国内的车企,尤其是新势力智驾第壹梯队,他们出于竞争的切实需求,很多在采取高阶智驾免费的策略或以变相的形式向用户赠送几年使用权来推广他们的智驾,你对目前这种商业模式可连续性怎么看?你希望的商业模式是怎样的?在目前情况之下车企和智驾供货商之间利益分配,你有啥思考么?
王晓刚:整体而言,今天汽车的发展很多事情看着还不够合理,很多事情也是不可持续的。我们当然希望市场能够回到正轨,所以不光是智驾本身的问题,是整个行业的问题。
另外比较关键的是要避免同质化的竞争,还是要做出既有用户价值,还有特色的功能产品。从产品设计、技术发展路线上而言,找到自己独特的路线和价值,这个才能实现可持续的发展。
在智驾里面,除了端到端自动驾驶,还需要做到舱驾融合,有些新的体验,另外,我们还跟车企有深入的合作,共创一些产品体验上的不同化,从而节省这些成本和投入。如果每个车企大伙都是采用不一样的配置标准,回传数据也都不一样的话,最终其实是没有办法让它实现可持续发展的。
Q:从财报来看汽车业务是近两年增长比较快的业务,那么从细分的构成上看,目前智舱和智驾营业收入或出货量占比上大概是啥样的结构?后续资源如何配比?之前商汤在智驾战略和组织架构方面有些调整,具体是咋样的情景?
王晓刚:从收入上看两边是差不多的,如果从出货量上来看,肯定座舱是高于智驾的。如果从研发投入上而言,现在更多研发投入是在智驾上,因为这里面本身的技术栈比较深,而且有很多的资源投入,从长期来说智驾会更多一些。
当前我们的组织架构更加的聚焦,之前项目相对分散一些,今天比较明确的像J6E和J6M的平台,还有端到端自动驾驶,客户也会更加聚焦,所以做了这方面的调整,主要是因为我们的产品和客户需求更加清晰了,更加聚焦在量产方面。