AI大模型可以从无到有地生产各种数据后,创造出的 海量数据 该怎么用成了新问题。
10月26日,在由界面新闻主办的2023 REAL科技大会上,腾讯 数字孪生 产品部/自动驾驶业务总经理苏奎峰发表了《 数字孪生 与生成式AI的闭环迭代进化》主题演讲。
苏奎峰认为外界对于 数字孪生 价值的领会存在诸多误区, 数字孪生 的真正价值在于可视、可算与可用。可视在于提供一个交互方式,如果一个孪生系统没有做到可视化,那么它将是失败的;可算即将物理世界模型化和参数化,以实时数据驱动和推演,再将虚实场景叠加在一起,最后获得更强和更大规模的计算模型,且这个计算模型可以根据设计者的切实需求随时编辑。可用体现在提供沉醉式、游戏化的交互体验,使得其在现实世界中可以无障碍使用,
他通过实际应用场景解释了 数字孪生 的价值。一辆货车送货,技术团队可以将装载、卸载、运输这些现实场景通过 数字孪生 建成数字世界。这个三维虚拟“世界”不仅要在视觉上做到了对物流世界的仿真还原,还务必可编辑的,例如改变车流方向、环境路况。
以他所负责的自动驾驶业务为例,自动驾驶行业当前最大的一个槽点就是缺数据。如果将 数字孪生 应用在自动驾驶的仿真系统中,一旦这套系统掌握了编辑能力,就可以根据开发者的切实需求进行二次开发设计。同时,还能通过这些可编辑数据再加上之前的 传感器 收集数据,便可以根据高质量的数据来训练AI大模型。大模型又可以生成完善自动驾驶功能期望的更多测试场景。
演讲结束后,苏奎峰接受了界面新闻记者的专访,谈了他思考 数字孪生 应用于自动驾驶的改变,及腾讯对于自动驾驶的投入战略,以下为专访内容(有删改):
界面新闻:大模型可以生成提供大量高质量、结构化的数据,这些AI生成数据能够解决自动驾驶缺数据的现状吗,通过这种方式与 传感器 捕捉数据相比有哪些不同?
苏奎峰:首先需要强调的是,现实数据一定是期望的,完全靠虚拟的数据肯定不会。
自动驾驶目前在数据上主要克服三个问题。第壹个是数据效率;第贰个就是极端状况数据(现实中无法复现测试);第叁个是样本均衡问题,如果某一类样本数据多,某一类样本数据少,也会影响最后的表现。
我们的解决方案就是通过 数字孪生 和 AIGC 结合。这种方案其实不是完全脱离了 传感器 ,而是通过 传感器 收集到了真实数据,收集完成数据,再通过 数字孪生 技术建模,相当于将一辆车行驶的现实场景重建成数字场景,并且我们还可以根据需求编辑这个三维的虚拟场景,做到了可视、可算和可用。
这套方案执行下来,第壹, 传感器 的数据保障了可靠性;第贰, 数字孪生 建立的场景又是可以编辑的,可根据自动驾驶测试的切实需求进行二次开发设计;第叁,如果编辑效率低,还能通过这些可编辑数据再加上之前的 传感器 收集数据, 训练出一个大模型。
我们目前在这上面所做的工作,于基本算法上已经有了雏形,现在开始验证一致性。
界面新闻:对于技术验证一致性后的落地使用,你有怎样的期待?
苏奎峰:很快,或许一年之后我们再见就可以讨论落地效果。
界面新闻:腾讯的自动驾驶业务现在隶属于 数字孪生 产品部,从公司战略角度,这代表了怎样的发展路线?
苏奎峰:我们思考自动驾驶是一项复合技术,它包含了 人工智能 的很多底层技术,例如感知、建模、决策规划。
自动驾驶的核心竞争力在于 数据要素 和计算资源的低成本获取和高效利用。对数据进行高效收集和利用,是整个自动驾驶技术迭代的关键点。 数字孪生 的虚拟仿真技术有助于加速自动驾驶的落地应用,且在服务于自动驾驶的同时,又拓展了自身的应用界限,例如 智慧城市 、工业数字化...。
其实不管自动驾驶还是 数字孪生 ,甚至于如今的 AIGC,我们如今的这个团队都有储蓄,随时做迁移,以覆盖自动驾驶的技术需要。
界面新闻:在自动驾驶业务领域,腾讯当前的计划仍然是给车缔造工具么?
苏奎峰:是的,腾讯做自动驾驶的定位就是数字化助手,这也和腾讯在产业互联网中的角色定位一致。
我们内部一开始也思考过造车与做Robotaxi类的自动驾驶算法提供商两条路线,但很快就被否决掉了。不造车,是因为它涉及生产制造领域的专业问题,与腾讯的互联网公司基因不符。不做算法提供商是因为商业模式,自动驾驶最终落地后的商业模型能不能成立,我们对此表示怀疑。
界面新闻:就BAT三家公司对自动驾驶的投入而言,腾讯怎么看各家近一两年来在这上面的调整?
苏奎峰:自动驾驶像所有行业一样,当它的现实发展符合大家的梦 想预期时,各家就会加大投入,市场也会相应放大。目前在这种状态下,大伙都收缩的时候,说明行业现阶段对这个事的认知与判断都很模糊。
如果把自动驾驶看成多项技术的集大成者,那行业就可以找到更多的商业出口和落地场景。如今的难处在于如何把技术和现有产业结合起来。
腾讯当前的调整是方向性的调整,但大战略没变。