【Gemini】谷歌大模型终于迈开大步 Gemini对决GPT-4

栏目导航

财经热点 > 财经资讯 > 谷歌大模型终于迈开大步 Gemini对决GPT-4

【Gemini】谷歌大模型终于迈开大步 Gemini对决GPT-4

浏览次数：【142】发布日期:2023-12-8 9:02:56 文章分类：财经资讯

专题：【Gemini】【久其软件】【GPT】

K图 GOOGL_0

K图 GOOG_0

　　美国时间12月6日，谷歌正式发布了Gemini大模型。谷歌总裁桑达尔·皮查伊(Sundar Pichai)称，这是谷歌迄今为止功能最强大、最通用的模型。

　　距离ChatGPT发布，已经过去一年零一周。随同着ChatGPT的发布，OpenAI成了人工智能领域最耀眼的企业，尤其是在大模型领域，它也是其它所有科技公司的追赶目标，其中包含谷歌。

　　过去八年，谷歌一直把AI-first作为公司战略，2016年打败人类围棋冠军的AlphaGo便是出自谷歌之手。毫不夸张地说，是谷歌掀起的一股AI浪潮，改变了整个AI行业的发展，但现在，它亟需在大模型领域证明自己。

　　据了解，在Gemini 1.0版本中包含三个不同尺寸，分别是Gemini Ultra、Gemini Pro、Gemini Nano。其中，Gemini Nano主要应用于设备端，Pixel 8 Pro将是第壹款搭载Gemini Nano的智能手机；Gemini Pro则适用于在各种任务中扩展，谷歌便计划用Gemini Pro来升级旗下的聊天机器人 Bard，和包含搜索、广告、Chrome等在内的更多谷歌产品。

　　对于功能最强悍的Gemini Ultra，谷歌称目前正在进行信任和安全检查，和通过微调和基于人类反馈的强化学习（RLHF）进一步完善模型，预计明年初向开发人员和企业客户推出。

　　桑达尔·皮查伊表示，Gemini的发布，是人工智能发展的一个重要里程碑，也是谷歌新时代的开始。

　　超越GPT-4？

　　据谷歌DeepMind首席执行官黛米斯·哈萨比斯（Demis Hassabis）介绍，Gemini是由谷歌团队从头开始构建的多模态模型，这意味着它可以概括并无缝理解、处理不同类型的信息，包含文本、代码、音频、图像和视频。

　　在性能测试上，Gemini Ultra在32个大语言模型基准测试中的30个超过了当前最优成绩，另外在MMLU（大规模多任务语言理解）中，Gemini Ultra的得分为90%，成为首个超越人类专家的大模型。

　　黛米斯·哈萨比斯称，在测试图像基准进程中，Gemini Ultra在没有来自图像字符识别（OCR）全面的协助下，就超越了此前最顶尖的模型。这些基准测试凸显了Gemini的多模态能力，也展现出其具有更复杂推理能力的早期迹象。

　　目前，建立多模态模型的标准方法主要是通过训练不同模态的单独组件，然后将它们拼接在一起。但这样操作的结果是，这些模型有时在执行某些任务（如描述图像）方面表现良好，但往往难以处理更复杂的推理。

　　“我们将Gemini设计为原生多模态，它从一开始就针对不同模态进行了预训练，然后我们使用额外的多模态数据对其进行微调，以进一步提高其效果。”黛米斯·哈萨比斯介绍道，“这帮助Gemini从头开始就能无缝理解和推理各种输入，远远优于现有的多模态模型，而且其能力在几乎所有领域都达到了最顶尖的水平。”

　　好比在推理方面，Gemini 1.0可以理解复杂的书面和视觉信息，它通过阅读、筛选和理解信息，能够从数十万份文档中提取见解。

　　另外，Gemini 1.0经过训练，可以同时识别和理解文本、图像、音频等，因此它能更好地理解微妙的信息，并能回答涉及复杂主题的问题，好比进行数学和物理等复杂学科的推理。

　　而在编码方面，Gemini 1.0能够理解、解释和生成全球最流行的编程语言（如Python、Java、C++和Go）的高质量代码。两年前，谷歌曾推出AI代码生成平台AlphaCode，现在在Gemini的助力下，该平台迭代到AlphaCode 2，性能也得到大幅提升，可以解决之前几乎两倍数量的问题。

　　仍在持续优化安全性

　　桑达尔·皮查伊表示，目前已经有数百万人正在使用谷歌产品中的生成式AI，做一年前还做不到的事情，从回答更复杂的问题到使用新工具进行协作和创造。这时，开发人员正在使用谷歌的模型和基础架构构建新的生成式AI应用程序，全球的草创公司和企业也正在利用谷歌的AI工具不断成长。

　　在其看来，这种趋势已经有些令人难以置信，可是，这还只是开始。

　　“我们正在大胆而负责任地开展这项工作。这意味着我们的研究要有雄心勃勃，追求能够为人类和社会造成巨大利益的能力，同时也要建立保障措施，并与政府和专家合作，以应对随着AI变得更加强大而引发的危险。”桑达尔·皮查伊称。

　　因此在Gemini的开发进程中，谷歌也加强了安全审查工作。黛米斯·哈萨比斯介绍，在谷歌的AI原则和产品安全政策基础上，谷歌团队正为Gemini的多模态能力添加新的保障措施。

　　不仅如此，黛米斯·哈萨比斯还强调，在开发的每个阶段，谷歌都会考虑潜在风险，并努力测试和减轻它们。

　　据了解，Gemini具有到目前为止所有谷歌AI模型中最全面的安全评估，包含对偏见和有害信息的评估。同时，为了识别内部评估方法中的盲点，谷歌还在与各种外部专家和团队合作，对Gemini模型在各种问题上进行压力测试。

　　另外值得注意的是，Gemini的练习是基于谷歌自己的张量处理单元(TPUs)——v4和v5e。在这些TPUs上，Gemini比谷歌之前的模型运行速度更快、成本更低。所以除了新模型外，谷歌还宣布将推出新的TPU系统——Cloud TPU v5p，这是专为训练尖端AI模型而设计的，也将用于Gemini的开发。

　　有业内人士向记者表示，谷歌此次发布的Gemini虽然在很多性能上超越了GPT-4，可是它与OpenAI仍存在时间差，GPT-4发布已经半年多，新一代模型应该也在开发进程中。

　　“所以对谷歌而言，与GPT-4进行各种基准测试的比较，只是展现其现阶段能力的一方面，能否依靠自身积累和强大的资源，缩短与OpenAI的时间差才是重点。”该人士指出。另外，Gemini作为谷歌在大模型时代构建的全新基础设施，比起测试数据，能否满足日经常使用户和企业客户，才是检验Gemini能力的真正标准。

　　黛米斯·哈萨比斯表示，谷歌已经开始在搜索中试验Gemini，它使用户的搜索生成体验变得更快，在美国的英语搜索中，延迟减少了40％，同时在质量方面也有所提升。

　　而接着，在加速Gemini 1.0落地应用的进程中，谷歌也在进一步扩展其未来版本的功能，包含增加上下文窗口以处理更多信息，进而提供更好的响应。

手机扫码浏览该文章

● 相关资讯专题

【OpenAI】【GPT】【大模型】【思考解题逻辑】

上一条 : 国际油价连连下跌 - 后市存在继续探底可能
下一条 : 财联社汽车早报-12月8日-

网站首页

主机域名

网站模板

网站开发

软件开发

财经资讯

金融工具

管理中心

栏目导航

关于我们

关于我们

付款方式

售后服务

主机域名

信息资讯

解决方案

网站建设

业务入口

服务支持

信息资讯

移动网站