【大模型】追一科技CEO吴悦 - L1级大模型商业化路径更短基于大模型技术的超级APP将会出现

栏目导航

财经热点 > 财经资讯 > 追一科技CEO吴悦 - L1级大模型商业化路径更短基于大模型技术的超级APP将会出现

【大模型】追一科技CEO吴悦 - L1级大模型商业化路径更短基于大模型技术的超级APP将会出现

浏览次数：【585】发布日期:2024-3-5 17:15:01 文章分类：财经资讯

专题：【大模型】【自然语言处理】【APP】【商业化】【CEO】

　　本期嘉宾简介：

　　吴悦，追一科技开创人兼总裁，中国科学技术大学硕士，原腾讯最年轻T4技术专家，搜索与AI平台部责任人。2006年加入腾讯，参与主持构建了分布式文件系统、大数据集群、大网页搜索引擎和推荐引擎等项目。

　　Key Points

　　1、大模型技术的出现对NLP领域发生了推翻性的影响，使得机器像人同样的聊天与对话成为可能。

　　2、L1级大模型的商业化路径相对较短，因为它们已经在客户端落地并显示出效率提升。

　　3、虽然大模型的研发投入巨大，但开源大模型的出现降低了成本压力。

　　4、Sora的推出被视为里程碑事件，尽管目前还不确定其在人类意识领域的突破水平。

　　5、基于大模型技术的超级APP将会出现，并且大模型的成本问题会通过规模化得到缓解。

　　近几年，人工智能至少有两海浪潮，一波以2023年ChatGPT的出世为开始，一波在更早之前，以2016年AlphaGo大战李世石为标志性事件。

　　追一科技就建立于2016年。追一科技开创人兼总裁吴悦回忆道，“我们2016年出来创业的时候，也是人工智能的高热期。在2012、2013年，深度学习应用于图像识别领域出现了技术突破。2016年AlphaGo战胜李世石也属于人工智能技术的一个突破。”

　　2006年，吴悦从中科大硕士结业后就进入了腾讯工作，2006-2011年，吴悦在腾讯主要做存储系统研发，2011年到2016年专攻搜索技术。

　　由于既做过基础架构，又做过搜索推荐等，吴悦看到了NLP（自然语言处理）技术的商业价值。“NLP在搜索领域诞生出了Google、百度这样的大公司；后来在推荐领域，诞生出了今日头条。在这个基础上，我们就判定NLP下一个爆发的方向应该是对话，所以2016年出来创业时就决策主攻NLP的对话机器人方向。”

　　这个猜想在今天得到了验证。生成式大模型是对NLP技术的推翻性改变，基于生成式大模型的ChatGPT也是人机对话的产品形式。

　　追一科技官方网站介绍称，追一科技主攻人工智能三大技术栈之一的NLP技术，拥有自研的领域大模型“追一博文”，并延展到智能语音、多模态的AI全栈技术，目前已累计服务300+企业/政府类客户，在2022年完成D轮融资。

　　以下是第壹财经与追一科技总裁吴悦的访谈内容：

　　嗅到对话风口，建立追一科技

　　第壹财经：你当时离开腾讯选择创业，是看到了啥机会？有啥契机？

　　吴悦：我们公司建立于2016年，正是和深度学习的这一海浪潮挂钩。因为我自己本身做过搜索和推荐，所用到的自然语言处理是人工智能其中一个比较重要的分支。我们看到了深度学习技术突破在自然语言处理方向造成的一些新的机会，这可能是第壹个比较重要的原因。第贰，具体在自然语言处理这个方向，我们在这一领域里做的时间比较久，团队先后做过几个重要的自然语言处理的应用系统：刚开始是搜索，也就是对网页和文字的处理，这是自然语言处理里极为重要的一个应用。随后又做过类似于头条这样的文本推荐系统。搜索和推荐我们都做过，从技术发展趋势上判断下一个应用的发展方向和机会点可能在人机对话方向。第叁，我们团队之前的背景主要是在互联网行业面向C端的应用，16年的时候看到了一个面向企业B端的机会点。综合这三个方面，我们决定出来创业，专注于自然语言处理人机对话面向企业B端的应用。

　　第壹财经：追一科技这几年推出了很多AI员工产品，这是你基于“下个方向是对话”而选择的策略么？

　　吴悦：对。对话有三种媒介：文字对话、语音对话和视频对话。文字对话最主要就是NLP技术。基于文字对话之上还可以叠加语音识别、语音合成等，那就是属于NLP叠加语音技术，变成了语音对话。在语音对话上，再加上一个视觉的数字人形象，变成一个视频对话。

　　第壹财经：现在许多人工智能公司，包含一些大厂都在做数字人。这是由市场需求决定的么？还是说落地门槛相对没有那么高？

　　吴悦：主要是市场需求决定的。因为抖音、视频号这种视频类的应用与社区在快速爆发，发生了很多的顾客需要和机会。另外，数字人底层技术在不断发展与突破，目前也有成熟的技术能够满足这样的切实需求。

　　第壹财经：对于不一样的行业，好比金融和政务领域，追一科技交付的AI员工产品有二致么？

　　吴悦：AI员工本质是产品叠加上企业私有的知识、流程与管理规则所构建的私有专用的AI模型。单从产品上来说没啥区别，它是一个标准化的产品，可是不一样的行业及各个企业之间的知识、流程与管理规则不一样，我们要把它们构建为企业私有专用的AI模型的并落地到标准化产品里面来。所以总结一下，产品是标准的，可是企业私有专用的AI模型是有不一样的。

　　第壹财经：这些精湛的知识是由企业客户自己提供？相当于追一科技交付一个标品，企业把自己的知识或自己的数据封装进去？

　　吴悦：是这样。但这个过程需要我们全程参与，因为企业软件产品这部分服务很关键，包含前期的咨询、售前，后期的实施和交付，到后面持续的运营，这些都是服务的一部分，这也是我们给客户提供的一种能力。所以其实面向企业而言，我们一手提供标准化产品，另一手提供标准化与专业化的服务。

　　第壹财经：追一科技发布的博文大模型是在开源大模型基础上优化而来的么？

　　吴悦：对，可以这么说，我们现在会基于多个开源模型和开源模型所用到的要领去构建自己的领域大模型。从另外一个角度来审视，因为我们一直做这个方向，所以在整个大模型的方向上也会做一些单点算法上的研究。过去我们也公开了一点算法，好比我们自研 Roformer 模型中的核心算法 RoPE（旋转位置编码）是追一科技为大语言模型技术发展做出的重要贡献，据公开资料显示，RoPE先后被 Google PaLM系列、Meta LLama系列、百川系列、ChatGLM系列等全球头部大语言模型所采用，成为LLM位置编码的主流方案。

　　第壹财经：未来几年，追一科技有啥计划与愿景？

　　吴悦：两个方向，一是面向于市场、客户的维度，我们还是会聚焦在中大型公司客户，好比像金融、运营商、政企类的顾客，围绕着客户的需求去创造价值，并且以给他们创造价值身为一个目标导向，不断对我们的产品进行迭代。另外，服务也很关键，要不断去提升我们的服务能力和水平，提升客户满意度。

　　其次，面向创新的维度，我们还是比较相信AI员工后面会普遍运用到企业里来。我们现在主要做企业对外的服务和营销，但渗透率不高，因此我们会抓住一些技术创新，例如说大模型多模态技术，不断基于技术创新来迭代产品，提高AI员工在企业场景的渗透率。

　　另外，要实现长期的商业化，第壹要有自我造血的能力，得有自己的业务根据地，也就是企业本身的立足点。有了这个立足点，未来再去做延展才是能够建立的。

　　“Sora给AI理解物理世界打开了一个口子”

　　第壹财经：去年ChatGPT爆火出圈后，人工智能进入2.0阶段，越来越多草创企业涌入AI赛道。过去的2023年，对追一科技而言意味着什么？是感受到了更多机会，还是更多竞争的压力？

　　吴悦：还是感受到的机会更多，当然压力肯定还是有的。因为毕竟大模型领域，最核心的就是要比拼技术。过去技术比较难突破，所以相对来说它可能针对不一样的业务需要，会有精湛的模型来做专门的研发。但大模型技术突破后，能力比较强，通常一个模型就能解决很多个问题。从这个视角来审视，会造成两方面的利润：一是效率提升，二是可以解决更多问题，应用场景上也有更多延展。好比我们之前应用在企业对外的客服场景居多，能力变强之后，我们在一些非常精湛的营销场景，甚至可能在一些产品定义的环节都能用到。所以甭管是从效率的提升，还是从产品的延展，都造成很多的机会。

　　压力大是因为大模型的研发投入还是蛮大的，因为要构建一个大模型在算力上的投入和开销是巨大的。可是后来看到像Llama 2，包含国内很多开源大模型，可以基于开源的技术，去研发自己的领域大模型，我们感受到成本大的压力得到了有效化解。

　　第壹财经：去年Open AI推出了ChatGPT，成为全年持续火爆的一个话题，今年年初又推出了Sora，再次给市场造成一波热潮，你如何看待Sora？

　　吴悦：第壹，Sora的出现的确是一个里程碑事件。从行业角度来审视，ChatGPT的突破是自然语言处理技术的突破。语言文字是人类独有的产物，动物或许有语言可是没有创造出来文字。语言文字承载了人类的智慧。我们的社会、商业的很多载体都是依靠语言文字完成的，ChatGPT的突破我认为可能是对人类意识世界的突破，因为它可以理解语言文字，而且生成的语言文字整体水平也不比人差。Sora其实相当于自动生成了真实世界的一些视频，我认为它可能是AI对现实世界明白的一个里程碑式的突破。第贰，ChatGPT对语言的领会、生成能力已经达到了很高的水平，我们可以认为它掌握了语言能力，可是我认为Sora还不一定掌握物理世界的能力，因为它更多是生成了一点跟这个物理世界非常相近、灵活、方便或低成本的视频，但这其实不能证明它对物理世界发生了理解，例如说很多的物理规律，牛顿定律之类。因此，我认为Sora可能打开了一个口子，它将来能不能真的在理解物理世界方面类似于ChatGPT在语言文字领域式的突破，还有相应的不确定性。

　　L1级大模型的商业化路径更短

　　第壹财经：L0级和L1级的大模型商业化目前处于一个怎样的进程？哪类大模型的落地变现相对来说更容易一些？

　　吴悦：L1级大模型（行业大模型）的商业化路径相对更短一些。以我们为例，例如讲我们的AI员工软件产品，我们是比较清楚地知道我们这几款机器人，包含在线语音和视频端的对话机器人在服务和营销进程中可以做怎样的辅助。因为产品已经在客户端落地。在落地进程中，我们看到了大模型对工作效率的提升，也看到我们在做对话的进程中，有一些问题过去的小模型解决得其实不是非常好，现在有了大模型，我们就可以把这个能力接入进来。

　　也包含一些新场景的应用，好比我们之前只做一些局部的自动化，因为这里面要处理非常复杂的对话，同时涉及到的知识数据也非常复杂，现在有了大模型，可以看到全过程的自动化，我们在落地进程中看到了大模型能够为我解决啥样的问题，我就很清晰地来定义大模型未来应该如何去做研发。在博文大模型里，我们提出了几点。第壹，如何融合企业的专业知识与专业技能。第贰，如何为企业实现降本增效。

　　我们目前没有做L0级（基础大模型）大模型，对L0级大模型遇到的具体困难和挑战不是特别明白，但我感受到国内做L0级大模型的企业，首先会面临开源大模型的竞争，至少对很多应用层的企业和客户而言，它会基于免费的开源大模型去做开发。

　　另外，L0级大模型会造成一些超级应用的机会，一是“明牌”，已经被国外大厂验证过的模式，但这块国内的大厂也会激烈竞争；二是“暗牌”，可能有一些大家还没看到的机会，时间窗口会是一个比较大的挑战。L0级大模型的投入的确很大，多长时间能够验证出来是关键。

　　第壹财经：现在市场上有一种观点，认为L0级大模型在C端的应用仅仅为了提升自身知名度，而后更好地向B端收费。

　　吴悦：我认为有难度。第壹点，从B端的需求来看，它期望的是比较成熟的软件产品和服务，这样才能够真正处理问题。要做产品化，要提供与产品相应配套的专业服务，单点的技术落地到企业端的链条比较长。第贰，落地在企业里的软件产品，技术是极为重要的，但还有一个很关键的条件是对企业Know-How的领会。因为我们的软件产品是根据企业客户需要来做定义的，对于头部企业客户理解越深刻，和它的业务场景结合越紧密，才能够拿到更完备的或说更深入的Know-How。Know-How的沉淀实际上就是需要时间周期的。好比大模型要落地到企业端，本身就面临企业知识如何融入的问题，也面临企业技能如何融入的问题。再一个，企业B端和C端的产品技术需求还是存在不一样的。C端需求特点是管理与维护单一的量级大和复杂的AI系统。企业B端需求特点是每个企业一个专用AI系统，需要考虑管理与维护多个量级和复杂度都中等的AI系统。

　　第壹财经：大模型未来会成为一个超级APP么？

　　吴悦：会。或说，一定会有基于大模型技术的超级APP出现。过去搜索网站本质也是一个技术主导的超级应用；包含像推荐算法，头条也算是一个基于文本推荐的超级APP。我认为包含目前ChatGPT，其实某种水平上已经算一个超级APP了。从国内的视角来看，国外已经验证的模式，我认为在国内肯定会出现，也不会特别远。

　　规模化可缓解大模型成本问题

　　第壹财经：目前甭管是2B还是2C的大模型，在成本方面仍然相当高，成本问题未来会有缓解的可能么？

　　吴悦：我觉得未来还是会很贵，因为AI还在不断发展，还会有更多的数据进来，需要更多算力，整体成本会越来越贵。但从单个用户的视角来看，它也有可能会变得能够承受，好比通过规模化来实现。同样一个大模型，甭管是 L0的通用大模型，还是L1的领域大模型，因为整体的产业发展，大模型所应用的场景或所获得的价值变得更大了，这样分担到每个用户或每次调用上的成本是不断降低的。

　　第壹财经：很多客户对大模型存在定制化需求，不同行业领域的顾客需求不同，但追一科技交付的是一个标品，是否会因此遇到难以铺开的困境？从行业来看，如何来平衡这个问题？

　　吴悦：定制化的大模型，对于有一定体量的顾客而言是可以接受的。因为我们是做企业软件，对企业软件的定制化是很艰难的。每个大客户都有自己个性化的一些需求，这些需求都会对应到软件可能需要涉及到的开发方面。过去中国企业软件就一直没有非常不错的规模化的一个非常标准的卡点，特别多的定制化，尤其是面向中大型公司客户。现在有了大模型之后，这个问题是得到缓解的。

　　打个比方，每个客户的切实需求是100%，以前可能100%都是要定制化开发代码来实现，现在可能70%已经变成了模型的定制化，这又是可以规模化的，剩下30%的切实需求需要定制化开发。现在大模型又可以写代码，可以通过低代码或大模型生成代码的形式来做优化。所以从这个视角来审视，有了大模型后，面向中大型公司客户的企业软件会有一个比较大的变化或机会。

　　第壹财经：为啥说大模型可以减少定制化需求？

　　吴悦：这里面还有一个深层的理论，企业软件过去是以人为核心的，人是个性化的，所以人会提各种各样的切实需求。如今的软件是以AI为核心的，减少了人的个性化输入，定制化需求的来源就会减少很多。

手机扫码浏览该文章

2024-9-21【公安部】公安部门出手！打击资本市场-小作文-

2024-9-20【全民仅退款】苹果手机标价五万多，-全民仅退款-APP卷款跑路？回应了

2024-9-20【消费者】记者调查多个渠道发现信息泄露风险极大甚至疑似刷单传销低成本-薅羊毛-？背后陷阱重重

2024-9-19【App】-西街观察-AI还没甩掉手机依赖症

2024-9-16【开发者】苹果变相打折-苹果税- App Store推出-回头客优惠-

2024-9-15【巨星传奇】IP变现渠道丰富多元巨星传奇-四步走-推进IP商业化

2024-9-12【消费者】花8000块云养一头猪到底靠不靠谱？

2024-9-12【iPhone】周鸿祎 - 不打算买iPhone16了华为Mate XT创新超过了苹果！

● 相关资讯专题