北京时间3月19日4时-6时,英伟达开创人黄仁勋将在美国加州圣何塞SAP中心登台,发表GTC 2024的主题演讲《见证AI的变革时刻》。鉴于过去一年多时间里AI造成的生产力变革,和英伟达等一众概念股的表现,老黄的演讲已经变成全球资本市场翘首以待的热门事件。
基于过去几周的大量前瞻报道,今天早上的主题演讲主要有数个重要看点:1)B100芯片的算力到底如何?能够将算力的能效比拉到怎样的高度?2)作为开发者大会,长达两个小时的Keynote里会展示多少软件侧的应用?3)黄仁勋曾表示, 人工智能 的下一个浪潮将是具身智能(embodied AI),今天的演讲会有多少 机器人 的份额?
在“AI皆热点”的时代环境下,全球算力龙头点到的每一个概念,都有可能成为接着资本市场万马奔涌的目标。
演讲即将开始,现场已经济济一堂。
播放开场影片。
黄仁勋登台,对观众们强调:我希望你们搞清楚今天这里不是演唱会,而是一场开发者大会。
黄仁勋介绍了本届GTC的一些参与者,并强调这些公司不只是来参会,而是有自己的东西要来展示。
黄仁勋展示英伟达发展史,又提了将首台DGX One送给OpenAI的故事。
黄仁勋:今天我们将讨论这个新行业的很多问题。我们要谈谈如何进行计算、我们要谈谈你所构建的软件类型,你将如何看待这个新软件,新行业中的应用然后,也许(再谈谈)下一步是啥,我们如何从今天开始做准备,下一步会发生什么。
黄仁勋:我们使用仿真工具来创造产品,其实不是为了降低计算成本,而是为了扩大计算规模。我们期待能够以完全保真、完全数字化的形式模拟我们所做的整个产品。从本质讲,我们称之为 数字孪生 。
老黄开始介绍一系列合作伙伴,包含ANSYS、Synopsis、Cadence等。
随着transformer模型被发明,我们能以惊人的速度扩展大型语言模型,实际上每六个月就能翻一番。而为了训练这些越来越大的模型,我们也需要更强的算力。
“非常强大”的Blackwell架构GPU登场。
老黄现场对照Blackwell架构和Grace Hopper架构的GPU。
老黄现场展示Grace-Blackwell系统(两个Blackwell GPU、四个die与一个Grace Cpu连接在一起)。GB200将两个B200 Blackwell GPU与一个基于Arm的Grace CPU进行配对。
为了处理大规模 数据中心 的GPU交互问题,也需要更强的连接(NVlink)能力。
这个GB200新系统提升在哪里呢?老黄举例称,如果要训练一个1.8万亿参数量的GPT模型,需要8000张Hopper GPU,消耗15兆瓦的电力,连续跑上90天。但如果使用Blackwell GPU,只需要2000张,同样跑90天只要消耗四分之一的电力。当然不只是训练,生成Token的成本也会随之降低。