商业热点 > 商业洞察 > DeepSeek平地起惊雷威胁了谁?大模型竞速搅动股市 - 科技巨头高市值隐忧加剧

【DeepSeek】DeepSeek平地起惊雷威胁了谁?大模型竞速搅动股市 - 科技巨头高市值隐忧加剧

查看信息来源】   发布日期:1-27 20:23:12    文章分类:商业洞察   
专题:DeepSeek】 【服务器

  小红书在海外应用市场的热度暂时下去了,在美区苹果商店,ChatGPT重新登顶,然而没过几天,中国企业又接上力了。1月27日,来自我国的AI公司DeepSeek成为美区苹果商店免费下载量第壹的App,ChatGPT再次“屈居”第贰。更令人叹为观止的是,DeepSeek不仅占据了美榜第壹,近两天还刷屏了全球市场,在微博上,DeepSeek也喜提多条热搜。

  凭借更少的算力、不俗的成果、开源的模式等优势,DeepSeek得到了业内众多大咖的赞美,也让国外竞争对手警惕,包含微软总裁纳德拉、Meta开创人兼总裁扎克伯格等。1月27日,游戏科学开创人兼总裁、《黑神话:悟空》制作人冯骥也在微博上对这家公司给出了高度肯定:“DeepSeek,可能是个国运级别的科技成果。”

  没想到,凭大模型能力率先火到海外的,不是“AI六小虎”中的任何一家,反而是一直以来相对低调的DeepSeek,该公司不仅给国内外的AI公司们拉响了警钟,其打破算力需求“怪圈”的表现,也对算力“统治者”英伟达造成了要挟。当地时间1月27日盘前,科技股遭巨震,英伟达、台积电、ASML、博通、微软、谷歌、亚马逊股票价格均下跌。

  海内外流量接踵而至

  截至发稿,DeepSeek不仅登顶了美区苹果商店的免费下载榜,记者发现,中国区苹果商店的免费下载榜单上,DeepSeek也跃居第壹。有第叁方统计数据显示,这款应用已经在20多个国家登顶下载榜单。

  受此消息利好,1月27日,DeepSeek相关概念股迎来大涨, 每日互动卓创资讯华金资本浙江东方 涨停,并行科技、 拓尔思 等上上涨幅度度居前。

  DeepSeek有啥特别之处呢?冯骥总结出了六条:“强大:比肩o1(OpenAI的推理模型)的推理能力;便宜:参数少,训练开销与使用费用小了一个数量级;开源:任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;免费:官方目前提供的服务完全免费,任何人随时随地可用;联网:暂时唯一支持联网搜索的推理模型;本土:DeepSeek是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。”

  推理能力方面,一周前,DeepSeek正式发布DeepSeek-R1,据称在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版;上个月,DeepSeek-V3首个版本上线并同步开源,在性能上和世界卓越的闭源模型GPT-4o和Claude-3.5-Sonnet不分伯仲。

  记者顺应潮流体验了一下DeepSeek的R1模型,在一些方面,使用体验的确可以用“丝滑”来形容:请它帮助写一首现代诗歌,R1给出的作品可以用“文风细腻、情感真挚”来阐述;紧接着又发送了一道微积分题目请R1帮助解答,R1很快给出了详细的解题流程,更有意思的是,如果疑问它给出的定论,该模型不仅会耐心地重新讲解一次,还会模拟人的情感来表达自己对于被疑问的不满。

  很多国内外的大咖已经对DeepSeek给出了高度肯定。纳德拉近日在达沃斯世界经济论坛上表示:“DeepSeek的新模型令人印象深刻,他们不仅有效地构建了一个开源模型,能够在推理计算时高效运行,而且在计算效率方面表现出色。我们务必非常认真地对待我国的AI进步。”AI科技草创公司Scale AI开创人亚历山大·王则称,DeepSeek的AI大模型性能大致与美国最好的模型相当,过去十年来,美国可能始终在 人工智能 竞赛中领先于中国,但DeepSeek的AI大模型发布可能会改变一切。

  独立于大厂的AI公司

  像冯骥总结的那样,DeepSeek的特殊性不仅仅在于其推理能力的强大,还在于这家公司用比其它AI公司少得多的成本达到了当前的“强大”。好比,DeepSeek-V3的总训练成本仅为557.6万美元,而o1、Claude、Gemini、Llama 3-405B等模型的练习成本动辄就是数亿美元。如果说ChatGPT是“大力出奇迹”,那么DeepSeek就是“四两拨千斤”。

  算力成本的下降,也让DeepSeek得以在面向开发者的时候拥有了“低价”的底气。如果对去年的大模型价格战还有印象的话,DeepSeek这个名字对许多人来说应该其实其实不陌生,就是这家企业打响了大模型降价的第壹枪。2024年5月6日,DeepSeek发布DeepSeek-V2开源MoE模型,其API接口定价直接下探至每百万tokens输入1元、输出2元(32K上下文),价格仅为当时GPT-4-Turbo的近百分之一。

  而开源则是业内认可DeepSeek的另外一大优点。OpenAI此前转向闭源,让很多业内人士颇有微词,曾作为联合开创人的马斯克公开炮轰:“现在OpenAI已经成为一个闭源的、最大利润的企业,由微软有效控制,压根不是我想要的。” 如今有了DeepSeek的对照,网友借用马斯克的话辣评:“OpenAI应该改名为ClosedAI。”

  其实在这轮出圈之前,DeepSeek已经以另外两种方式刷屏国内的社交媒体:一是不久前传言小米公司老总雷军亲自以千万年薪挖走的罗福莉,就来自这家公司;二是这家公司的开创人梁文锋,不久前参加1月20日召开的由专家、企业家和教科文卫体等领域代表参与的总理座谈会。

  DeepSeek,中文全称为“杭州深度求索 人工智能 基础技术研究有限公司”,建立于2023年7月。不同于“AI六小虎”,这家AI公司没有背靠大厂,甚至成立一年多以来,没有任何融资记录,这与过去两年时不时宣布融资消息的“AI六小虎”形成鲜明对照。

  然而,没有融资不等于没钱,反而代表这家公司不缺钱。天眼查数据显示,DeepSeek的股东包含持股99%的宁波程恩企业管理咨询合伙公司(有限合伙)和持股1%的梁文锋,宁波程恩企业管理咨询合伙公司(有限合伙)也由梁文锋直接和间接持股。

  更关键的是,梁文锋同时也是幻方的开创人。幻方是一家依靠数学与 人工智能 进行量化投资的对冲基金公司,在量化私募圈,素有“北九坤,南幻方”“四大天王”的说法,幻方经过多年成长,已经成为私募基金行业的巨头,说白了,DeepSeek背后的梁文锋和幻方,本身就是极具实力的资本。

  而从团队人员和数量来看,DeepSeek就是一家集聚了一群年轻人的AI公司。OpenAI前政策主管、Anthropic联合开创人Jack Clark此前曾认为DeepSeek雇用了“一批高深莫测的奇才”,梁文锋之后在接受媒体采访时透露,并没有啥高深莫测的奇才,都是来自TOP高校的结业生,和没结业的博四、博五实习生,还有一些结业才几年的年轻人;另外,DeepSeek的团队规模也无法与OpenAI相比,记者了解到,在团队配置上,DeepSeek团队只有139名研发人员,OpenAI团队则有1200名科研人员。

  那么,DeepSeek是怎样做到全球刷屏的呢?360集团开创人周鸿祎就此表示,首先在还没有看到 AI芯片 战略价值的时候,这家公司(背后的幻方)就拿自己量化交易赚来的钱做了显卡储蓄,其次,DeepSeek综合使用的是注意力架构和MoE混合专家模型架构,另辟蹊径,实现了高效推理和经济高效的练习。简单而言,DeepSeek走得不是算力堆砌之路,而是算力创新之路。

  “受伤”的可能是英伟达

  当然,对于DeepSeek,目前市场上其实其实不是只有赞誉。

  有体验过的网友认为,在写代码方面,DeepSeek不及Anthropic公司的Claude和OpenAI的o1,却是强在性价比;还有网友指出,自己用DeepSeek算了两道数学题,给出的定论都是错的,并晒出了截图。

  “其实要说DeepSeek已经超越了ChatGPT,现在还为时尚早,当然这家公司已经达到了一个非常的水平。”顺福资本开创人李明顺对《华夏时报》记者表示,其实现在AI大模型底座在能力上已经到了一个平台期,此时应用也在快速释放,在这种情景下,模型的成本和效率会成为大家更关注的一个方向,如今DeepSeek下载量暴涨,也算赢得了很多C端用户的认可,这也让其在未来实现产业目标这条路上有更大的存在性。

  但务必承认的是,不管当前市场上的评价咋样,DeepSeek的表现的确引发了行业巨震,不仅是AI行业,还有 AI芯片 行业。从更大的维度动身,DeepSeek的成功,某种水平上是我国在AI领域突破外国技术封锁的一个缩影。

  Meta开创人兼总裁扎克伯格就“破防”了,他表示,DeepSeek非常先进,并认为中美之间的AI差距非常小,如果将来有一个开源模型能被全世界广泛使用,希望它是一个美国模型;ChatGPT首席执行官Sam Altman更是突然宣布ChatGPT o3-mini免费。

  而在算力方面,DeepSeek的算力创新,可能会让半导体行业的估值逻辑发生改变。相信大伙都明白,在大模型产业快速爆发的这两年,受益最大的就是GPU霸主英伟达,业绩与股票价格双丰收,一旦对算力的切实需求骤减,英伟达便首当其冲会受到冲击。

  李明顺告诉本站记者,他在一年前就预测,英伟达的股票价格可能会腰斩,如今看来,DeepSeek很可能就是其股票价格腰斩的导火索。“以前硅谷认为大模型需要大力出奇迹,需要大量的算力进行投资,也造成了大厂之间的‘军备竞赛’,TOP20的大厂,包含微软、亚马逊、OpenAI、Meta,甚至是马斯克的xAI,都投入了大量的钱财购买算力,而在中国,字节跳动、阿里巴巴、腾讯、百度也买了很多英伟达的芯片,这造成了一个很畸形的商业生态,一旦大家发现算力的投入没有那么好的ROI(投资回报率),只要有几家大厂停止这方面的投入,其它公司就可能效仿,而在英伟达的相关收入中,TOP20的企业可能就占了一半,因此这种趋势会对英伟达的收入造成大的冲击。”

  说白了,未来其它AI公司可能效仿DeepSeek,通过算力创新来减少算力投入。至于将来的大模型是否不再需要大规模的算力比拼、不再需要像大厂那样斥巨资购买芯片,《华夏时报》记者就此邮件采访了DeepSeek方面,截至发稿未收到回复。

  李明顺还指出,英伟达的采购圈子中有许多中间商,其实其实不是最终的顾客,这些中间商是不是囤积了大量的英伟达芯片,没法做很清楚的描述,但现在市场上的算力,其实有很多地方是淤的,其实其实不能消费出去,如果从财报的视角来说也可以打一个问号。“再加上DeepSeek已经打包到AMD的一个解决方案中去了,还可能让整个运算成本下降30%,这对于英伟达来说太致命了,所以其股票价格现在面临着很大的危机。”

  两天前,英伟达的老对手AMD 宣布,已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,该模型经过 SGLang 强化,针对 Al 推理进行了优化。

  或许是受到这些消息的影响,资本市场引发了对科技股估值的担忧。当地时间1月26日,英伟达股票价格跌3.12%至142.62美元/股,市值为3.49万亿美元;当地时间1月27日盘前,截至发稿,英伟达股票价格大跌超12%,台积电大跌超9%,ASML大跌超8%,博通跌超14%,微软、谷歌、亚马逊股票价格也有所下跌。

手机扫码浏览该文章
 ● 相关商业动态
 ● 相关商业热点
DeepSeek】  【人工智能】  【英伟达】  【线上服务】  【OpenAI】  【大规模】  【幻方量化】  【量化基金公司】  【奇安信】  【网络攻击】  【阿斯麦】  【2024】  【半导体】  【GPT】  【冲击波】