商业洞察

【英伟达】英伟达发布Nemotron系列大语言模型 - 欲推动代理式AI加速崛起

查看信息来源】   1-7 11:33:29  
英伟达】【黄仁勋】【自动驾驶汽车】【CEO


K图 NVDA_0

  在今日召开的CES 2025大会上,英伟达开创人兼总裁黄仁勋发布了全新的 Llama Nemotron系列大语言模型。

  黄仁勋表示, 人工智能 正在进入一个新时代——代理式 人工智能 (agentic AI),精湛的AI代理可以助推人们解决复杂问题并自动执行重复性任务。

  他进一步表示,借助定制的 AI 代理,各行各业的企业都能实现空前绝后的生产力。然而,这些顶尖的 AI 代理需要一套针对代理 AI 功能和能力进行优化的多个生成式 AI 模型系统。这种复杂性意味着对强大、高效的企业级模型的切实需求从未如此强烈。

  英伟达此次推出的Llama Nemotron模型,有Nano、Super和Ultra三个不同版本。其中,Nano是最具成本效益、低延迟的模型,适合在PC和边缘设备上部署。

  Super是一种高精度模型,在平衡计算效率的同时具有更高的准确性;而Ultra是最高精度模型,专为要求最高性能的 数据中心 规模应用而设计。

  黄仁勋称,这些模型基于Llama 构建,可助推开发人员在一系列应用程序中建立和部署AI代理,包含客户支持、欺诈检测和产品供应链和库存管理优化。

  在性能上,Llama Nemotron模型经过精简和训练,采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色,同时进行了大小优化,可在英伟达广泛的加速计算资源上运行。

  据黄仁勋介绍,Llama Nemotron模型系列将以可下载模型和NVIDIA NIM微服务的形式提供,可轻松部署在云端、 数据中心 、PC 和工作站上。

  企业还可以使用 NVIDIA NeMo 微服务针对其特定用例和领域定制模型,以简化数据管理、加速模型定制和评估。同时,借助NVIDIA NeMo Retriever,开发人员可以集成检索增强生成功能,将模型连接到他们的企业数据。

繁体中文