ChatGPT横空出世引发人们对AI大模型的极高关注,随后更强大的GPT-4在今年3月发布,让众人更关注——我国的GPT模型何时能实现赶超?我国的科研人员始终在努力。在10月31日举办的2023云栖大会上,阿里云首席技术官周靖人公布了 云计算 基础能力的最新进展,升级了 人工智能 平台,并发布千亿级参数规模的大模型通义千问2.0,和一条龙模型应用开发平台阿里云百炼。他表示,阿里云已初步建成AI时代全栈的 云计算 体系,“中国大模型公司一半跑在阿里云上。”
通义千问2.0发布:超越GPT-3.5追赶GPT-4
此次云栖大会上,阿里云正式发布千亿级参数大模型通义千问2.0。而且,在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。
周靖人表示,过去6个月,通义千问2.0在性能上实现巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有明显提升。在10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
据介绍,中英文理解能力是大语言模型的基本功。在英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4,通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,通义千问2.0以明显优势在C-Eval基准获得最高得分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4
在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问位列第贰,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5,该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的条件。
简单而言,通义千问更成熟了,也更好用了。通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官方网站上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
周靖人:阿里云全面升级AI基础设施
记者留意到,作为国内最早开源自研大模型的科技公司,阿里云正掀起中国大模型开源浪潮。“目前,中国有一半大模型公司跑在阿里云上,280万AI开发者活跃在阿里云魔搭社区上,未来,阿里云将携手千行百业推动AI创新,共享技术红利。”周靖人透露,魔搭社区现已聚集2300多款AI模型,吸引280万名AI开发者,AI模型下载量突破1亿,是我国规模最大、开发者最活跃的AI社区。
在周靖人看来,大模型是本轮AI浪潮的核心技术,基础模型的质量很大水平决定了AI产业化的前景。训练大模型是囊括了算力底座、网络、存储、 大数据 、AI框架、AI模型等复杂技术的系统性工程,只有强大的 云计算 体系才能训练出高质量的大模型。
周靖人表示,2009年阿里云就提出“ 数据中心 是一台计算机”的宗旨,今天,AI时代更加需要这样的技术体系。为了保证大模型训练的稳定互联和高效并行计算,阿里云全新升级了 人工智能 平台PAI。PAI底层采用HPN 7.0新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,远超业界水平;在大模型训练任务中,可节省超过50%算力资源,性能全球领先。
阿里云通义大模型系列就是基于 人工智能 平台PAI训练而成。除了通义大模型,中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、 昆仑万维 、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。而且,阿里云已成为中国大模型的公共AI算力底座。直到今天,中国众多头部主流大模型都已通过阿里云对外提供API服务,包含通义系列、Baichuan系列、智谱AI ChatGLM系列、姜子牙通用大模型等。另外,阿里云已在全球30个地域建设了89个 云计算 数据中心 ,应对未来大规模智能算力需求的爆发。
另外,周靖人在会上还宣布,阿里云计划近期开源通义千问72B版本,将成为中国参数最大的开源模型。此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。阿里云将持续支持千行百业的开发者基于通义千问开源模型进行模型和应用创新。截至10月,已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
“打样”8个行业大模型,让云走向“自动驾驶”
周靖人说:“随着大模型技术与 云计算 本身的融合,我们希望将来的云可以像车一样也能够自动驾驶,大幅提升开发者使用云的体验。”据了解,阿里云上有超过30款云产品接入了大模型能力,例如阿里云 大数据 治理平台DataWorks新增了全新的交互形态——Copilot,用户只需用自然语言输入即可生成SQL,并自动执行相应的数据ETL操作,整体开发与分析可提效30%以上,堪比“自动驾驶”。阿里云容器、数据库等产品上也提供了类似的开发体验,可实现NL2SQL、SQL注释生成/纠错/优化等功能,未来这些能力还将集成到阿里云其它产品上。
在云栖大会现场,周靖人还发布了一条龙大模型应用开发平台——阿里云百炼,该平台提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。
为推动大模型更易在千行百业集成落地,阿里云基于通义“打样”了8个行业大模型,并在现场公布进展:个性化角色创作平台通义星尘、智能投研助手通义点金、AI阅读助手通义智文等第壹次亮相;智能编码助手通义灵码已在阿里云内部大规模采用;工作学习AI助手通义听悟每天处理5万余个音视频,累积用户超100万。
如今,大模型正引发千行百业的新一轮创新。会上,央视网、 朗新科技 、亚信科技等企业也分享了率先在阿里云百炼上开发专属模型和应用的体验,同时, 朗新科技 在云上训练出电力专属大模型,开发“电力账单解读智能助手”“电力行业政策解析/数据分析助手”,为客户接待提效50%、降低投诉70%。
2023云栖大会上,阿里云宣布了一项重磅计划:“云工开物计划”,给中国所有大学生每人送一台云服务器。另外,阿里云还将为签约高校提供更大规模的算力资源支持,助力中国青年学者和学子攀登科研高峰。目前,清华大学、北京大学、浙江大学、上海交通大学、中国科学技术大学、华南理工大学等高校已首批达成合作。