安大互联
财经热点 > 财经资讯 > 电影里的人工智能照进现实?GPT-4o挑战苹果Siri
【GPT】电影里的人工智能照进现实?GPT-4o挑战苹果Siri
浏览次数:【497】  发布日期:2024-5-14 16:50:39    文章分类:财经资讯   
专题:GPT】 【OpenAI】 【人工智能】 【Siri
 

  电影里的 人工智能 已经照进现实?当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。在现场演示中,GPT-4o能实现接近人类反应时间的实时交互,能帮助用户实时解答数学方程式,甚至还能实时听人类呼吸声判断深呼吸节奏是否正确、给出实时情感反馈。

  很多网友在看完发布会后表示,升级后的GPT-4o似乎是更智能版的苹果Siri。近期有媒体透露称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

  南都记者了解获悉,GPT-4o的升级迭代主要在于四方面:一是融媒能力更强,GPT-4o已同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答;二是速度更快、反应时间接近人类;三是GPT-4o将面向ChatGPT的所有付费和免费用户发布;四是ChatGPT在不用注册即可使用的条件上,还增加了桌面程序,交互更便利。

  在融媒能力方面,发布会上,研究主管Mike Chen和Beridzov轮番演示。当Mike Chen向GPT-4o表示自己在发布会上较为焦虑时,GPT-4o快速安慰“别紧张,深呼吸,记住你可是专家”。当Mike Chen顽皮地假装遵从GPT-4o的建议,“激烈”地呼吸时,GPT-4o发出了笑声并调侃“你不是吸尘器”,并一对一实时指导Mike Chen呼吸要诀,当“发觉”到Mike Chen呼吸正常时,GPT-4o赞许地表示“就是这样”。

  据Mike Chen总结介绍,用户使用GPT-4o可以感受到以下几方面的升级:一是用户可以随时打断模型,不用等到模型完成一个回合即可插话,二是模型升级后能实时响应、没有时延,三是模型学会了情感解读。后续根据研究主管Beridzov的演示,当Beridzov将手机镜头拍摄自己在一张纸上演示线性方程式时,GPT-4o能实时给予指导和解法。

  发布会上, OpenAI 的首席技术官 Mira Murati还介绍,GPT-4o的文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,但速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。

  同时,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍,普通用户达到使用上限后会切换回GPT-3.5版本。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

  英伟达科学家 Jim Fan发表评论称,从技术角度来审视,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。

  他还表示,GPT-4o更接近GPT-5了,在Google明天将举行的I/O 大会之前发布,OpenAI赢得了更多时间、非常明智。而GPT-4o也更加活泼,更像电影中的《她》了,更像是向一个更具情感和个性的 AI 转变,此前OpenAI 似乎始终在积极抑制这种变化。

  据了解,OpenAI本次现场演示选择的声音是“Sky”,该声音听起来酷似科幻爱情片《她(Her)》中的“萨曼莎”。该电影讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声“萨曼莎”,“萨曼莎”嗓音性感、风趣幽默、善解人意,让孤独的男主泥足深陷。而“萨曼莎”的配音演员正是斯嘉丽·约翰逊。

  发布会当天,奥特曼自己也在X上发了这部电影的称号《她(Her)》,还有人干脆把电影海报里的脸换成了奥特曼的。

  很多网友看完发布会的第壹感觉是,升级后GPT-4o似乎正在挑战苹果Siri。不过前不久,有媒体透露称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

  Jim Fan强调,“谁先赢得苹果谁将大获全胜”。在Jim Fan看来,GPT-4o与苹果iOS可以在三个条理上整合。“一是抛弃 Siri。OpenAI 为 iOS 提炼出一个更小层级、纯粹设备上的 GPT-4o,可选择付费升级以使用云端;二是将摄像头或屏幕传输到模型的原生功能里,芯片级支持神经音频/视频编解码器;三是与 iOS 系统级操作API和 智能家居 API 集成。这可能会成为从一开始就拥有10亿用户的 AI 代理产品。”

  在发布会之外,OpenAI 总裁萨姆·奥特曼发布博文表示,GPT-4o新的语音(和视频)模式是自己用过的最好的计算机界面。“感觉就像电影里的 人工智能 一样;我依旧有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”

  奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠价格)向人们提供功能强大的 人工智能 工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了全球最好的模型,并且没有广告或类似的东西。我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的 人工智能 服务(希望如此)。”

手机扫码浏览该文章
 ● 相关资讯推荐
2024-7-1【人工智能】AIGC善用也要善治 - 媒体行业探索它的新场景新空间
2024-7-1【人工智能】国家经济发展动力源与人才需求
2024-7-1【金山办公】金山办公 -股价-会受到上周五WPS系统崩溃影响 国内大模型未-套壳-OpenAI
2024-7-1【人工智能】科技公司对AI的投资与回报能成正比吗?高盛对此提出质疑
2024-7-1【金山办公】盘中跌超9% 金山办公 -股价-会受到上周五WPS系统崩溃影响 国内大模型未-套壳-OpenAI
2024-7-1【金山办公】盘中逼近跌停,金山办公 -股价-会受到上周五WPS系统崩溃影响,国内大模型未-套壳-OpenAI
2024-7-1【人工智能】如何以善-管-促善-智-
2024-7-1【人工智能】打造吸收外资-强磁场- 稳外资举措将加码
2024-7-1【AIPC】AI PC是否预示-个人智算-即将涌现
2024-6-30【大模型】大模型市场洗牌-价格战-开打 头部企业以-深耕行业+出海-尝试破局
 ● 相关资讯专题
人工智能】  【AIGC】  【动力源】  【国家经济】  【金山办公】  【OpenAI】  【WPS】  【科技公司】  【API】  【消费者】  【外商投资】  【强磁场】  【AIPC】  【微软公司】  【个人智算】  【大模型】  【周鸿祎】  【价格战】 
  • 网络建设业务咨询

   TEl:13626712526