商业洞察

【图森未来】图森未来为何要从自动驾驶驶转向AIGC?

查看信息来源】   12-23 18:15:27  
图森未来】【自动驾驶】【AIGC

  昔日自动驾驶明星公司图森未来在经历退市等一系列风波后,已经重新选择了创业航向。

  2024年8月,公司第壹次透露将瞄准AIGC方向,四个月后的12月17日,公司宣布启用全新品牌CreateAI,并发布了其首个图生视频大模型产品“Ruyi”。

  目前,Ruyi-Mini-7B版本已经在huggingface上正式开源,用户可以从下载使用,记者了解到,“Ruyi”专为在消费级显卡(例如 RTX 4090)上运行。

  从自动驾驶转向AIGC,好调头么?

  公司为何从自动驾驶迈向判然不一样的视觉大模型赛道?

  图森未来技术责任人在接受蓝鲸新闻专访时告诉蓝鲸新闻,此次转型主要是从公司转型和业务发展的视角动身。一方面,公司之前在做自动驾驶时已经在AI领域积累了算法、算力和数据经验;另一方面,联合开创人陈默在游戏圈有资源积累,有机会快速将技术落地。

  陈默也在此前接受媒体采访时提到,图森未来在试图寻找一条更快能够依靠现有资源“救活”公司的路,随着视觉模型技术的不断推进和公开,AIGC成为在商业化空间、技术可达性方面都符合基本条件的一个当前的最佳选择。

  据蓝鲸新闻了解,图森未来做视觉模型的团队就是此前公司做自动驾驶的团队,一些技术经验可以复用。

  图森未来技术责任人谈道,AI视觉模型和自动驾驶都依赖于算法、算力和数据这“三驾马车”来推动技术发展,且两者都依赖大量的数据进行训练和优化。而视频生成技术与自动驾驶中的感知模块非常相似,两者都以数据驱动为主,研发路径相对较短,依赖的技术基础也比较清晰。

  在他看来, 自动驾驶技术涉及感知、定位、规划、控制等多个算法模块,和软件系统、硬件设计、车辆结构设计等多个领域。相比之下,视频模型技术的研发路径更短,技术面更窄,主要聚焦在数据处理和模型训练方面。

  “数据的重要性甚至超过算法,”图森未来技术责任人强调,他提到图森在自动驾驶领域积累了丰富的数据标注经验,拥有自建的标注团队和标注平台,并建立了完整的数据处理流程。 “这些经验和工具可以直接应用到视频模型的数据准备阶段,从而节省大量时间和成本。”

  当然,在很多视觉模型的技术和效果上,图森还需要从零开始探索。目前,公司视频模型主要围绕五大关键指标进行:生成质量、一致性、可控性、易用性和成本。

  图森未来技术责任人告诉蓝鲸新闻,模型生成质量是首要目标, 确保生成的视频内容在画面、动作、细节等方面达到高水平。“公司采取螺旋上升式的研发策略,在保证生成质量和一致性的条件下,逐步提升模型的可控性、易用性和成本效益。”

  图森选择第叁条路:不靠模型挣钱,自己下场做内容

  当下,视觉模型领域新进展不断,当地时间12月9日,美国OpenAI公司正式发布了最新版本的视频生成大模型Sora-Turbo,它能够根据文本、图像或视频输入生成新的视频内容。另外,国内市场,不论是字节、快手等大型科技巨头,还是创业公司Pika、爱诗科技、生数科技等都在持续有紧锣密鼓的推进技术和产品迭代。

  图森的入局是否是想在竞争激烈的视觉大模型赛道分一杯羹?

  从目前公司的业务进展和采访中得知,这个答案是否。图森未来技术责任人告诉蓝鲸新闻,更准确的说法是,图森未来要成为一家内容公司而非大模型技术公司,和快手等平台和Pika等创业公司的方向其实不相同。

  目前,市场上视觉大模型的商业模式无非两种:一类是Runway、Pika等公司,面向C端用户,提供付费的视频生成工具或服务,让创作者付费自制内容;另一类是面向B端影视文娱和游戏等公司,帮助产业降本增效。

  图森未来技术责任人向蓝鲸新闻谈道,如果定位成纯粹的视频模型公司,to C和to B都存在明显挑战:

  一方面,to C方向,视频生成工具的目标用户群是专业创作者,而非普通大众,收费模式和盈利前景都不明确,且视频模型需要大量的算力支持,运营成本高,国内市场,很难在短时间内依靠收费,吸引用户并实现盈利。

  另一方面,单纯面向B端的技术赋能落地挑战巨大,因为技术公司很难深入了解具体场景的切实需求,也很难将技术有效地融入到实际的制作流程中,控制内容的质量和风格。

  相比很多视频模型正在将重心瞄准在追求技术的通用性上,图森选择了不同 的第叁条路:直接把模型技术开源,不靠模型挣钱,并购入了经典IP,自己下场用大模型做内容。

  据蓝鲸新闻了解,公司目前有专门的动漫和游戏团队已经在开发新项目。

  “我们希望缔造一家以AI技术驱动的视频内容创作公司,缔造端到端的视频内容生成链条。最终通过优质内容来吸引用户和实现商业价值。”图森未来技术责任人说道。“技术只是工具,最终的目标是为用户提供内容。”

  目前,图森已经布局动漫、游戏板块,其全新品牌CreateAI已经获著名武侠IP《金庸群侠传》正版授权,将开发一款大型武侠开放世界RPG游戏。2024年8月,公司也官宣了和上海三体动漫有限公司达成合作,共同开发《三体》系列的首部动画长篇电影和视频游戏。据了解,公司也会在12月推出 SLG 游戏工具和游戏本身。

  “我们现在拥有「金庸群侠传」和「三体」这两个顶级 IP,我们的目标是在 2027 年实现 10 亿美元的收入。”陈默在最近一次接受采访时说到了图森在AIGC方向的未来目标。

繁体中文