在全球范围内,大模型技术正以空前绝后的速度发展,成为 人工智能 领域的焦点。从大洋彼岸的硅谷到国内,科技公司和研究机构都在竞相探索这一领域的无限可能。
刚刚结束的两会上,“新质生产力”成为热词。缔造新的经济增长点需要发展新质生产力,而以多模态大语言模型为代表的 人工智能 技术将成为形成新质生产力的重要引擎。
作为国内头部基座大模型公司,智谱AI在过去一年中备受关注。去年6月,在科技媒体The Information的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一。目前来看,在技术与商业落地两方面,智谱AI都交出了超预期的成绩单。
经历过屡次升级迭代,2024年1月,智谱AI正式推出了新一代基座大模型GLM-4,整体性能相比上一代大幅提升。GLM-4可支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,迫近DALLE-3。
当然,在大模型竞争中,模型性能只是其中一环。在头部厂商都已完成算法备案的当下,快速搭建生态、实现商业落地并最终跑通数据飞轮是各家厂商谋求长期发展的一定选择。
这方面智谱AI同样先行一步。面向开发者,智谱AI推出了GLMs 个性化智能体定制,用户用简单提示词指令即能建立属于自己的 GLM 智能体,无需编程基础;面向B端客户,GLM-4已登陆MaaS(Model as a Service)平台,提供API访问。
要充分释放大模型的价值,从基础大模型到上层应用、从插件到开发者,商业生态中的每一环都必不可少。作为国内头部大模型厂商,智谱AI在这方面的探索颇具借鉴意义。
AGI离不开商业落地
在一年前,智谱AI发布了千亿参数对话基座模型ChatGLM。同一天,OpenAI发布GPT-4、Anthropic则发布了对标ChatGPT的Claude。
尽管当时ChatGLM已经是国内最早可以线上测试使用的千亿级的对话模型,可是毕竟与OpenAI同台竞技,智谱AI仍面临着诸多疑问。关于大模型到底怎么用、商业化落地如何去实现这些问题都有待探讨,甚至还有观点认为要重新考虑是否有必要做我国的大模型。
在一年后的今天,智谱AI所完成的四次技术升级、所实现的1000+大模型规模化应用则是对上述疑问的最好回应。“我们交出了一份还可以的答卷。”智谱AI 总裁张鹏说。截止当前,智谱AI已经有2000+生态合作伙伴、1000+大模型规模化应用、与200多家企业进行了深度共创。
马蜂窝与智谱AI的合作是诸多典型案例之一。作为头部旅行社交平台,马蜂窝曾面临着一项挑战:怎样在海量的旅游内容中,帮助用户快速、精准地筛选出有价值的信息,提升用户体验。以往的运营模式无法根据用户不一样的旅行偏好和需求,自动化的提供个性化的旅游内容和产品服务,也缺乏开发、变现大量非结构化高质量内容的有效手段。
在解决这一难题的进程中,大模型技术成为一剂良药。以智谱AI的大模型技术为基础,双方合作缔造了AI小蚂应用。记者了解到,这一应用不仅能够结合历史对话信息、指代信息进行用户输入补全,还能从历史对话中抽取POI关键信息、天气信息等,建立用户行程信息库,用于后续的对话回忆、问题引导和精准回答。
这一合作的成果明显。据统计,该应用通过准确性、完整性、实用性三个维度的评测,全链路测评分数可达80+。
这便是对大模型商业价值的直观诠释。足够长的上下文窗口长度令大模型应用能够提供精准、个性化的用户服务,语义理解与推理能力则使得大模型应用解决实际问题的效率远超传统方案。
随着国内大模型厂商纷纷推出能力对标GPT-4的新模型,“百模大战”似乎也进入到新阶段。继续追赶OpenAI所代表的世界先进水平的同时,大模型商业化探索也开始进入行业议程。一个行业共识在于,只有通过商业化落地,AGI才能得到真正验证。
经历了2023年的探索,产业界已经走出“所有行业都值得用大模型重构一遍”的兴奋感,逐步转向务实阶段。客户琐碎的切实需求与大模型部署成本之间的矛盾始终存在,哪些高频场景、以何种形式交付能跑通ROI都需要进行探索。
为了找到适配场景,在每遇到一个企业客户时,智谱AI都会画矩阵进行研究分析,纵轴显示模型基础能力,横轴则是企业业务节点,以此观察彼此的对应关系。
在分析结果的条件上,智谱AI会以MaaS的商业化落地路径,进一步针对不同客群类型和需求提供云端API、云端私有化、本地私有化、软硬件结合一体机等多种商业解决方案,以求提供更符合国情的大模型方案交付。
除马蜂窝之外,其余行业头部客户包含华泰金融、蒙牛、上汽乘用车、贝壳、WPS等。在华泰金融的案例中,双方合作构建了新一代的财富管理助手,解决了传统技术无法对意图进行精准识别、无法与客户之间进行多轮交互的问题;基于智谱GLM系列大模型,叠加了40-50G金融专业书籍、资讯等金融专业数据进行增量训练,和投研、客服场景上万条高质量指令集进行指令微调,华泰金融大模型1.0在效果上相较于通用大模型提升了10至20%。
与头部客户的合作一方面为智谱AI造成了可观的商业回报,但更重要的一点在于,客户丰富的场景数据也为智谱AI积累了垂直领域的调参经验,帮助智谱AI更好地理解行业需求。至此智谱AI生态的良性循环已经初步成型。
缔造应用合作共赢
站在如今的中国大模型赛道回望就会发现,整个赛道正在从拥挤走向分层。
在过去一段时期,我国的大模型赛道一度拥挤不堪。但很快高企的GPU价格和训练成本,让许多参与者进入了冷静期。曾于2023年年初喊出大模型口号的200多家公司,到现在仍保持活跃的也仅剩20余家。为了在有限空间内争夺生存空间,行业参与者务必探索自己的角色,行业生态也由此形成。
张鹏曾将大模型行业的生态分为L0、L1、L2三层,分别意指基础模型、行业模型及面向更加细分场景的推理模型。行业模型(L1)及细分场景的推理模型(L2)则是基于通用模型(L0)增强出来的。
智谱AI 总裁张鹏图片来源:智谱AI
更通俗的来讲,树木与果实,或许可以用来形容通用模型与行业应用之间的关系。通用模型提供为行业应用提供支撑与养分,行业应用则是树上结出的的果实,它将通用模型的潜力具体化、个性化,满足市场的精准需求。
对于将AGI视作最终目标的智谱AI而言,继续做通用基座模型是已经规划好的道路。但尚处于早期的大模型行业需要智谱AI承担更多责任,即一方面聚焦于国产全自研、自主可控基座大模型的开发,另一方面推动构建完善的中国大模型产业生态圈。
早在2019年智谱AI便已经开始对预训练模型框架进行研发,这成了后续推出千亿基座模型GLM-130B的技术基础。时间上的先发优势使得智谱AI得以更早展开商业落地的探索。
据张鹏回忆,在大模型市场火热之前,智谱AI就已经基于模型尝试做企业化交付。“在早期存在特别多的问题,我们干脆就和合作伙伴一起摸着石头过河,幸运的是我们走通了一条路,找到了在中国市场让大模型落地产业形成价值的要领。”他说。
从马蜂窝、华泰金融等许多案例中都能看出智谱AI与客户共创的思路。在受访环节,面对技术突破、拓展国际市场等话题,“合作共赢”这一关键词被张鹏屡次提及。客户具备行业实践经验,但苦于没有引入AI技术的能力,智谱AI则对大模型本质、如何应用等诸多问题有着成熟思考。双方协作磨合才能实现更有价值的应用落地。
现阶段来看,智谱AI日渐丰富的商业应用案例进一步证明了大模型技术赋能千行百业的可行性,大模型商业化之路方兴未已。随着大模型多模态能力的进一步提高,2024年 人工智能 的革命性潜力将进一步释放。
“‘我因遇到风暴而激动如大海。’这句话来自诗人里尔克。浪潮涌起,总有勇敢屹立潮头之人。”张鹏说。在这场生成式 人工智能 浪潮里,张鹏无疑是头部的弄潮儿。在技术与商业落地两方面均有所建树之后,智谱AI会走向何方,值得期待。