商业洞察

【大浪淘沙】中国大模型-狂飙-又一年 -大浪淘沙-后-由有到专-

查看信息来源】   12-27 0:38:01  

  不久前,随着OpenAI长达12天的“马拉松式”新品发布会告一段落,这家全球瞩目的大模型明星 独角兽 图谋占领全球科技媒体的头条,但除了Sora等个别关注度高的新品外,实际并未掀起太大的涟漪。与两年前发布堪称AI领域“原子弹”的ChatGPT-3.5相比,大模型过去一年的“进化”恰如这场漫长的发布会,小步快跑、持续迭代,却很难再现令人眼前一亮的巨大飞跃。

  将目光收回国内,中国大模型在经历去年白热化的“百模大战”后,今年又迎来了“大浪淘沙”,竞争格局趋于稳定,显现互联网大厂与草创公司“共舞”的格局。随着大模型技术演进曲线趋于平缓,怎样落地成为被摆在台面、亟待解决的问题,不同行业玩家开始调整各自的业务重点与前进方向,这或将在2025年迎来更为激烈的“生死战”。

  技术演进曲线走向平缓

  行业竞争格局走向收敛

  “OpenAI年末的线上发布会,从侧面说明了基础模型的能力可能已到达了一个临界点,技术进步的曲线已从陡峭走向平缓。”一名 人工智能 行业资深从业人士在接受证券时报记者采访时表示。

  在大模型领域,Scaling Law(规模定律)被普遍推崇。所谓Scaling Law,指的是随着参数规模、训练数据集及计算资源越多,大模型的性能将越好。然而,业内开始形成的一个共识是,大模型规模已到达一定水平,加上高质量训练数据逐渐枯竭,大模型能力的进化速度与去年相比有所放缓,能力并没有特别突出的提升。

  不过,虽然指数级的能力增长未在今年复现,但国产大模型在技术层面始终在进步。对国内大模型行业而言,技术迭代速度放缓是件好事,领跑的人速度变慢,追赶者就获得了更多的时间窗口。今年6月,在全球权威测评中,阿里通义千问Qwen2-72B超越美国最强开源模型Llama3-70B,问鼎全球性能最强的开源模型;12月,字节跳动火山引擎对豆包大模型家族进行全面升级,其中通用模型Pro已全面对齐OpenAI最新的GPT-4o模型。

  “经过两年的发展,中国大模型在技术上获得了长足的进步。各大厂商和研究机构纷纷推出新一代大模型,不仅在参数规模上有所提升,更在算法优化、性能提升等方面获得了明显成果。”北京社科院研究员王鹏向证券时报记者表示。

  在2023年初野蛮生长期的“百模大战”之后,行业在2024年经历了一场大浪淘沙,行业竞争格局从分散走向“收敛”。咨询机构弗若斯特沙利文指出,中国目前在通用基础大模型领域的竞争者已缩减至20余家,主要由互联网企业、 云计算 巨头及 人工智能 创业公司主导。

  一方面,中国大模型创业公司在2024年形成了相对稳定的“六小虎”格局,智谱AI、月之暗面、MiniMax、百川智能、零一万物和阶跃星辰在投资机构一轮又一轮的钱财加持下,迅速成长为AI 独角兽 。其中,智谱AI、月之暗面、百川智能均已跻身估值“200亿俱乐部”,这一速度是上个时代“AI四小龙”们所望尘莫及的,显示了大模型时代技术演进与融资历程的加快。

  另一方面,我国的传统互联网巨头们也在表演“大象起舞”。百度是最早布局大模型的大厂,今年11月举行的百度世界2024大会上,百度首席技术官王海峰透露大模型产品文心一言的用户规模已达到4.3亿。动作稍慢的腾讯和字节跳动今年也在全力加大对大模型的投入,腾讯在今年5月推出了基于混元大模型的AI助手APP腾讯元宝,字节跳动也凭借着流量投放的优势让旗下的AI大模型应用“豆包”活跃用户数在短时间超越一众竞争对手。

  “这反映了当前中国大模型市场的多元化和竞争性。”针对传统巨头与草创公司“共舞”的现象,王鹏向记者表示,创业公司的优势则在于创新能力强、反应速度快、市场敏感度高等,能够更快地捕捉市场机会和技术趋势,推出更具创新性和不同化的产品和服务。而互联网大厂资金雄厚、技术积累丰富、用户基础广泛,同时还能够通过自身的生态系统和资源整合能力,为大模型的发展提供更加广阔的空间和机会。“二者各有优劣,谁能脱颖而出还需要看各自的技术实力、市场策略和执行能力。”王鹏说。

  产业链上下游处境分化

  模型厂商发展路径分野

  据咨询机构赛智时代研究报告,大模型产业链主要包含上游基础层、中游模型层和下游应用层。其中,基础层主要包含算力和数据,模型层主要包含通用大模型和行业大模型,应用层主要包含生活消费应用、产业经济应用和公共服务应用等。

  值得注意的是,2024年,一级市场的大模型产品也频繁引爆二级市场,相继诞生了Kimi概念股、智谱AI概念股和豆包概念股,开了A股市场以创业公司设立概念板块的先河。“这反映了市场对于 人工智能 长期发展潜力的认可和对未来盈利模式的乐观预期。”天使投资人、资深 人工智能 专家郭涛在接受证券时报记者采访时表示。在这些概念板块中,不仅包含为产品提供算力支持及数据服务的厂商,也包含在主要产品中接入该大模型以实现产品升级的各行业公司。

  与全球芯片巨头英伟达在AI大模型的风口下营业收入与股票价格齐飞一样,随着国产大模型的加快发展,各大厂商在AI算力扩展、 AI芯片 采购和 数据中心 升级领域的资本开支持续增加,产业链上游尤其是算力基础设施率先受益。数据显示,年初以来, 算力概念 指数累计上涨幅度达47.66%,服务器概念指数累计上涨幅度达84.03%。“资本市场的表现往往基于对公司基本面和行业趋势的综合判断。”郭涛认为,相关概念板块的优异表现,表明投资者普遍认为随着大模型技术的不断进步和应用场景的丰富,对高性能计算能力和专业基础设施的切实需求将持续增长,从而带动相关产业链上下游企业的业绩增长。

  与产业链上下游相比,处于中游的模型厂商却普遍面临盈利困境。一方面,从云服务商手中购买算力开支巨大;另一方面,产品商业化目前仍处于探索阶段,远未能形成稳定和足够覆盖成本的收入。同时,以字节火山引擎、阿里云、百度云为代表的云厂商在2024年掀起了大模型价格战,降价幅度普遍达到90%以上,有的甚至直接免费。云厂商的目标是通过降价,以大模型来获取云客户,但价格战让一些资金实力本就不足的厂商“火上浇油”。

  在激烈的市场竞争中,尤其是在互联网大厂直接下场“搏斗”的2024年,AI大模型创业公司告别同质化竞争,发展路径开始分野。例如,很早就开始探索商业化的智谱AI主要发力B端市场,而主打大模型应用的月之暗面则以C端市场见长,MiniMax发力多模态与海外市场,百川智能当前的精力主要聚焦在医疗模型和产品领域。

  政策密集催化前景可期

  行业从淘汰赛走向生死战

  今年3月,开展“ 人工智能 +”行动第壹次被写入2024年《政府工作报告》, 人工智能 被赋予了实现技术变革、推动产业深度转型升级的重要意义,也成为当前加快培育新质生产力的重要抓手。

  今年以来,各地 人工智能 产业相关政策密集出台。例如12月18日,深圳印发《深圳缔造 人工智能 先锋城市的若干措施》,其中提出每年发放最高5亿元“训力券”、5000万元“语料券”、1亿元“模型券”等金银财宝的措施,以超常规力度增进 人工智能 产业的快速发展。除此以外,北京、上海、成都等城市也不断扩大产业支援力度,彼其间你追我赶。

  “大模型厂商的角逐,已经不只是投资机构之间的竞争,而是已经上升到各个城市产业布局、发展规划的层面。”一名资深的 创投 行业从业者向证券时报记者表示,投资人在与一些一线城市政府官员交流时,往往惊诧于他们对行业的了解之多、认识之深,而且全国多地都已设立 人工智能 产业投资基金,AI 独角兽 背后往往也站着国资背景的股东。

  “当前, 人工智能 政策环境趋于友好,政府加大支援力度,增进了产学研用协同创新,为大模型的发展提供了良好的生态土壤。”郭涛表示,政策的持续催化,为AI大模型的发展前景增添了较强的确定性。展望2025年,相关领域的投入仍然有望持续增加,带动国产大模型在技术创新上的继续深化和应用场景的进一步拓展。

  如果说2023年的“百模大战”是“从无到有”,那么2024年国产大模型所经历的“大浪淘沙”则是“由有到专”,而进入2025年,行业或将从“淘汰赛”进入到更激烈与残酷的“生死战”。中国科学院院士、清华大学计算机系教授张钹曾公开表示,即便大模型落地之后,也只有少数企业能活下来,因为暂时还没有那么大的市场,而且中国在AI投入的资本并没有那么大,还极度分散。“务必集中资源,因为我们的资源原本就少。”张钹说。

  虽然 人工智能 代表着未来已经成为行业共识,可是哪个能够引领这个未来却依旧悬而未决。以大模型“六小虎”为例,尽管它们获得了亮眼的成绩,但同时也面临着巨额资金的持续投入、技术商业化落地等挑战。同时,在经历了2024年火箭般的融资速度后,它们的估值已经达到了较高的水平,明年的融资可能会面临一定的调整压力。“一方面,高估值可能造成部分投资者持谨慎态度;另一方面,创业公司需证明其商业模式的可连续性和盈利能力以吸引后续投资。预计下一阶段融资将更加重视公司的核心竞争力和市场表现,而非单纯依赖概念炒作。”郭涛表示。

繁体中文