安大互联
财经热点 > 财经资讯 > AI大模型-开闭源-论战再起 商业价值决定路线选择 - GAI进化论
【Qwen】AI大模型-开闭源-论战再起 商业价值决定路线选择 - GAI进化论
浏览次数:【190】  发布日期:2024-4-28 21:21:41    文章分类:财经资讯   
专题:Qwen】 【1100亿
 

  最近,Meta发布了其最新版本的开源大模型Llama 3,引起开源AI社区“地震”。众多业内人士将其称之为“迄今为止功能最强的开源LLM(大语言模型)”。

  但与技术变革相伴而生的,是又一轮“开源闭源”的争议浪潮。

  4月27日,在 人工智能 行业从业六年,美国最为颇有知名度的AI创业者之一的Arsenii Shatokhin在一场采访中直言,企业自己运行开源大模型效率低于闭源,在他公司的顾客中只有一两个有足够资源,来精调或运行700亿参数的Llama开源模型。

  而与其持有同样观点的还有百度开创人李彦宏,日前他在Create 2024百度AI开发者大会上直言:“开源模型会越来越落伍,Llama 3比之前发布的任何开源模型都大得多,对他的顾客而言,使用这款开源大模型,反而不如闭源的商业大模型效率高。”

  此言一出立即引起了AI业界的争辩浪潮,“开源忠实信徒”周鸿祎便在公共场所发表观点称,“我是一直相信开源的,至于说网上有些名人瞎说,你们别被诱导了,他说开源不如闭源好?连说这话的企业自己都是借助了开源的力量才成长到今天。”

  对此,衔远科技COO、开创合伙人王晓波在接受21世纪经济报道记者采访时表示,选择走通用 人工智能 之路的基座大模型路线核心特点是“赢者通吃”。

  “这个行业可能会有许多玩家入局、但最后活下来的可能只有几家。而使用开源大模型路线的企业在业务开展速度方面有着明显优势,但缺点是较易被替代。”王晓波说道。

  开源闭源之争

  自OpenAI横空出世以来,开源和闭源的决策一直是大模型领域的热点话题,OpenAI的GPT-4模型就是采用闭源模式,微软则开源了WizardLM-2。国内,百川智能、智源都是开源的支持者,通义千问亦有开源,而华为盘古大模型则坚定选择不开源。

  纵览众多公司的不同选择,背后的起点仍然是商业价值的不同。

  在李彦宏看来,闭源,是有真正商业模式的,是能够挣到钱的,能够挣到钱才能聚集算力、人才。闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定更低,响应速度一定更快。“闭源模型在能力上会持续领先,而不是一时领先;模型开源也不是一个众人拾柴火焰高的情景。这跟以往的软件开源——好比Linux、安卓等很不一样。”

  另外,李彦宏提到,不管中美,当前最强的条件模型都是闭源的。通过基础模型降维做出来的模型也是更好的,这使得闭源在成本、效率上更有优势。对于AI创业者而言,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要长期的坚持才能跑出来。

  后来周鸿祎又解释称,“自己说开源好,不是针对李厂长,只是从产业发展的视角来看开源和闭源。”

  从长期的视角来看,的确有越来越多的从业者开始警惕使用开源大模型而造成的被替代性风险。

  2023年5月,谷歌内部泄露的文件《我们没有护城河,OpenAI也木有》在SemiAnalysis网站上流传,其中的说法包含,比起开源社区需要谷歌,谷歌更需要开源社区...。文章作者指出,不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手,与开源AI竞争的结果一定是失败。

  创业公司的决策

  不管选择哪条路线,对于当前国内AI大模型生态而言,最关键的是寻找到一个适当的落地场景和商业化路径。

  李彦宏日前在一场内部演讲中表示,一些做模型的创业公司所谓的“双轮驱动”不是一个好模式,既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,当资源有限时更应该专注,而不是去搞所谓的“双轮驱动”。

  在他看来,市场上有大量模型,大的、小的、开源的、闭源的,在特定应用当中如何使用这些模型的组合是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。

  清华大学电子工程系长聘教授、衔远科技开创人周伯文同样持有类似的说法。

  最近,周伯文在MODI摹小仙AI营销大脑(以下简称MODI)发布现场表示,要让 人工智能 快速落地,实现AGI,需在保持泛化性的条件上解决专业化问题。通专融合的新架构,即交互式持续学习框架。通用大模型与专业小模型协同生成框架,大模型提供高阶推理能力来指导内容框架的生成,专业化小模型进行知识填充与个性化内容生成。

  “AGI的通专融合泛化能力不是一个算法,需要系统化的设计和思考,所以我和我的科研团队,我们一起提出来AGI之路多条理依赖的新的架构,这里面会包含基础模型智能,这个基础模型是大模型智能,具有通用到专业能力的迭代。在算法协同上需要完成泛化和专业性的结合,具备专业通用的系统,它通向AGI的必由之路,在场景下能够自主探索、迭代、强化学习,这三层是互相作用的,未来AGI需要具备协同,需要具备交付的一种智能。在三个模型的要领研究下是可以互相互动的,不是一个容易的线性的依存关系,每一层的提升同时也是对其它两层的帮助。”周伯文说道。

  这时,周伯文表示,在基础模型基础上,需要更多的在通用能力上的数据飞轮,也包含专业能力上的数据增强,包含领域的深层检索,从通用能力到专业基础模型增强,还需要具备多功能专业模型的融合机制,当然也包含快模型和慢模型的展开,还需要学习和交付能力,不同模型和不同专业度上的协同,能够有效检测到一个模型在啥情境下发生幻觉。据他透露,目前,MODI已开放测试申请,预计五月下旬正式上线。

手机扫码浏览该文章
 ● 相关资讯推荐
2024-5-4【iPhone】美股成交额前20 - 苹果大涨约6% 财报超预期并宣布1100亿美元股票回购计划
2024-4-29【Qwen】AI大模型-开闭源-论战再起 商业价值决定路线选择
2024-4-28【Qwen】AI大模型-开闭源-论战再起 商业价值决定路线选择 - GAI进化论
2024-4-27【大模型】大模型开闭源之争加剧 - 美国AI创业者测试开源大模型的效率
2024-4-23【Llama】中国银河给予计算机行业推荐评级 - 多重因素引致美股剧烈调整 Meta发布最新开源大模型Llama-3
 ● 相关资讯专题
iPhone】  【iPad】  【Qwen】  【1100亿】  【大模型】  【创业者】  【Llama】  【Meta】  【中国银河】  【计算机行业】  【新开源】 
  • 网络建设业务咨询

   TEl:13626712526