安大互联
财经热点 > 财经资讯 > 电影里的人工智能照进现实?GPT-4o挑战苹果Siri
【GPT】电影里的人工智能照进现实?GPT-4o挑战苹果Siri
浏览次数:【495】  发布日期:2024-5-14 16:50:39    文章分类:财经资讯   
专题:GPT】 【OpenAI】 【人工智能】 【Siri
 

  电影里的 人工智能 已经照进现实?当地时间5月13日上午10点,OpenAI在春季发布会上发布了GPT-4的迭代版本——GPT-4o。在现场演示中,GPT-4o能实现接近人类反应时间的实时交互,能帮助用户实时解答数学方程式,甚至还能实时听人类呼吸声判断深呼吸节奏是否正确、给出实时情感反馈。

  很多网友在看完发布会后表示,升级后的GPT-4o似乎是更智能版的苹果Siri。近期有媒体透露称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

  南都记者了解获悉,GPT-4o的升级迭代主要在于四方面:一是融媒能力更强,GPT-4o已同时具备文本、图片、视频、音频多方面的能力,即可以接受任何文本、音频等形式及其组合的输入,并生成同样媒介形式的回答;二是速度更快、反应时间接近人类;三是GPT-4o将面向ChatGPT的所有付费和免费用户发布;四是ChatGPT在不用注册即可使用的条件上,还增加了桌面程序,交互更便利。

  在融媒能力方面,发布会上,研究主管Mike Chen和Beridzov轮番演示。当Mike Chen向GPT-4o表示自己在发布会上较为焦虑时,GPT-4o快速安慰“别紧张,深呼吸,记住你可是专家”。当Mike Chen顽皮地假装遵从GPT-4o的建议,“激烈”地呼吸时,GPT-4o发出了笑声并调侃“你不是吸尘器”,并一对一实时指导Mike Chen呼吸要诀,当“发觉”到Mike Chen呼吸正常时,GPT-4o赞许地表示“就是这样”。

  据Mike Chen总结介绍,用户使用GPT-4o可以感受到以下几方面的升级:一是用户可以随时打断模型,不用等到模型完成一个回合即可插话,二是模型升级后能实时响应、没有时延,三是模型学会了情感解读。后续根据研究主管Beridzov的演示,当Beridzov将手机镜头拍摄自己在一张纸上演示线性方程式时,GPT-4o能实时给予指导和解法。

  发布会上, OpenAI 的首席技术官 Mira Murati还介绍,GPT-4o的文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,但速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。

  同时,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍,普通用户达到使用上限后会切换回GPT-3.5版本。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

  英伟达科学家 Jim Fan发表评论称,从技术角度来审视,OpenAI 已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输。这些需要对 token 化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。

  他还表示,GPT-4o更接近GPT-5了,在Google明天将举行的I/O 大会之前发布,OpenAI赢得了更多时间、非常明智。而GPT-4o也更加活泼,更像电影中的《她》了,更像是向一个更具情感和个性的 AI 转变,此前OpenAI 似乎始终在积极抑制这种变化。

  据了解,OpenAI本次现场演示选择的声音是“Sky”,该声音听起来酷似科幻爱情片《她(Her)》中的“萨曼莎”。该电影讲述了作家西奥多在结束了一段令他心碎的爱情长跑之后,爱上了电脑操作系统里的女声“萨曼莎”,“萨曼莎”嗓音性感、风趣幽默、善解人意,让孤独的男主泥足深陷。而“萨曼莎”的配音演员正是斯嘉丽·约翰逊。

  发布会当天,奥特曼自己也在X上发了这部电影的称号《她(Her)》,还有人干脆把电影海报里的脸换成了奥特曼的。

  很多网友看完发布会的第壹感觉是,升级后GPT-4o似乎正在挑战苹果Siri。不过前不久,有媒体透露称,苹果已经与OpenAI达成协议,将在全新操作系统iOS 18中引入ChatGPT技术。

  Jim Fan强调,“谁先赢得苹果谁将大获全胜”。在Jim Fan看来,GPT-4o与苹果iOS可以在三个条理上整合。“一是抛弃 Siri。OpenAI 为 iOS 提炼出一个更小层级、纯粹设备上的 GPT-4o,可选择付费升级以使用云端;二是将摄像头或屏幕传输到模型的原生功能里,芯片级支持神经音频/视频编解码器;三是与 iOS 系统级操作API和 智能家居 API 集成。这可能会成为从一开始就拥有10亿用户的 AI 代理产品。”

  在发布会之外,OpenAI 总裁萨姆·奥特曼发布博文表示,GPT-4o新的语音(和视频)模式是自己用过的最好的计算机界面。“感觉就像电影里的 人工智能 一样;我依旧有点惊讶它是真的。事实证明,达到人类水平的响应时间和表达能力是一个巨大的变化。”

  奥特曼还提到,OpenAI的重要使命之一就是免费(或以优惠价格)向人们提供功能强大的 人工智能 工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了全球最好的模型,并且没有广告或类似的东西。我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的 人工智能 服务(希望如此)。”

手机扫码浏览该文章
 ● 相关资讯推荐
2024-6-29【OpenAI】欧盟加大对AI巨头审查 - OpenAI、微软与谷歌在列
2024-6-29【人工智能】硬科技投向标-上交所终止华卓精科科创板发行上市审核 星曜半导体完成10亿元B轮融资
2024-6-29【科学城】聚焦人工智能与大数据 - 清华校友三创大赛在渝举行
2024-6-29【人工智能】公募半年收益榜出炉 - 权益-冠军基-涨超30% 重仓高股息、AI赚嗨了
2024-6-29【OpenAI】最新!-微软-OpenAI-组合引发欧盟警惕 反垄断高官确认已开启调查
2024-6-29【高股息】A股下半年布局聚焦三大方向
2024-6-29【人工智能】国家级科技盛宴-2024中国·AI盛典-在央视播出 深圳元素秀出-创新之都-科技实力
2024-6-29【人工智能】全国首个司法审判垂直领域大模型在深诞生 -人工智能+审判-深度融合
2024-6-29【OpenAI】-微软-OpenAI-组合引发欧盟警惕 反垄断高官确认已开启调查
2024-6-28【马斯克】-控制狂魔-与-弄权高手-之争!马斯克退出OpenAI内幕曝光
 ● 相关资讯专题
OpenAI】  【130亿】  【人工智能】  【半导体】  【硬科技】  【科创板发行上市审核】  【科学城】  【人工智能与大数据】  【高股息】  【冠军基】  【微软-OpenAI】  【生产力】  【下半年】  【2024】  【《2024中国·AI盛典》】  【创新之都】  【人工智能+审判】  【马斯克】  【阿尔特】  【弄权高手】  【控制狂魔】 
  • 网络建设业务咨询

   TEl:13626712526