商业洞察
【英伟达】英伟达发布Nemotron系列大语言模型 - 欲推动代理式AI加速崛起
【查看信息来源】 1-7 11:33:29
在今日召开的CES 2025大会上,英伟达开创人兼总裁黄仁勋发布了全新的 Llama Nemotron系列大语言模型。
黄仁勋表示, 人工智能 正在进入一个新时代——代理式 人工智能 (agentic AI),精湛的AI代理可以助推人们解决复杂问题并自动执行重复性任务。
他进一步表示,借助定制的 AI 代理,各行各业的企业都能实现空前绝后的生产力。然而,这些顶尖的 AI 代理需要一套针对代理 AI 功能和能力进行优化的多个生成式 AI 模型系统。这种复杂性意味着对强大、高效的企业级模型的切实需求从未如此强烈。
英伟达此次推出的Llama Nemotron模型,有Nano、Super和Ultra三个不同版本。其中,Nano是最具成本效益、低延迟的模型,适合在PC和边缘设备上部署。
Super是一种高精度模型,在平衡计算效率的同时具有更高的准确性;而Ultra是最高精度模型,专为要求最高性能的 数据中心 规模应用而设计。
黄仁勋称,这些模型基于Llama 构建,可助推开发人员在一系列应用程序中建立和部署AI代理,包含客户支持、欺诈检测和产品供应链和库存管理优化。
在性能上,Llama Nemotron模型经过精简和训练,采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色,同时进行了大小优化,可在英伟达广泛的加速计算资源上运行。
据黄仁勋介绍,Llama Nemotron模型系列将以可下载模型和NVIDIA NIM微服务的形式提供,可轻松部署在云端、 数据中心 、PC 和工作站上。
企业还可以使用 NVIDIA NeMo 微服务针对其特定用例和领域定制模型,以简化数据管理、加速模型定制和评估。同时,借助NVIDIA NeMo Retriever,开发人员可以集成检索增强生成功能,将模型连接到他们的企业数据。