商业洞察
【DeepSeek】AMD火速-站台-DeepSeek 利空英伟达?美国私募 - GPU市场格局或被改写!
【查看信息来源】 1-26 23:19:57
距离深度求索(DeepSeek)推理大模型DeepSeek-R1发布已经过去近一周时间,开源模型DeepSeek-V3也已经发布了近30天。然而,在海外社交媒体平台上,甚至华尔街,DeepSeek的热度才刚刚开始。
1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第叁,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第壹。
就在Arena放榜之后,全球关于DeepSeek的讨论再次升级,美股市场 人工智能 (AI)的狂欢,也开始在DeepSeek的影响下哆嗦。
DeepSeek-V3在仅使用2048块H800 GPU的情景下,完成了6710亿参数模型的练习,成本仅为557.6万美元,远低于其它顶级模型的练习成本(如GPT-4的10亿美元)。因此,一些人认为,DeepSeek可能会推翻英伟达在AI硬件领域的主导地位。
而就在1月25日,英伟达的“老对手”AMD还火速为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。
美国私人投资基金Noah's Arc Capital Management认为,DeepSeek-V3模型的突破明显降低了AI培训成本,使AMD GPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。
DeepSeek成“美股最大要挟”?
OpenAI的成功来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量显现指数级增长。这种“军备竞赛”型开发模式,造成了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。
DeepSeek的低成本意味着,大模型对算力投入的切实需求可能会从训练侧向推理侧倾斜,即未来对推理算力的切实需求将成为主要驱动力。而英伟达等硬件商的传统优势更多聚焦在训练侧,这可能会对其市场地位和战略布局发生影响。
海外媒体Vital Knowledge,德国世界报知名市场评论员Holger Zschaepitz,都不约而同地把DeepSeek称之为“美国股市最大的要挟”。网络社群里,越来越多的人把DeepSeek与近期英伟达的回调联系在一起——1月24日,英伟达股票价格大跌3.12%,创下公司在年初CES展产品不及预期表现后的最大下下跌幅度度。
美股大V“THE SHORT BEAR”在社交媒体上表示,DeepSeek创造了一个AI巨头们的苦难时刻,而投资者务必对此敲响警钟,“根据红杉,美国AI公司每年务必发生约6000亿美元收入来支付其AI硬件费用。但现在看来,这种冒险行为变得越来越没有利益可谋求。”
海外知名财经博客Zerohedge1月24日撰文称,DeepSeek的出现和其廉价的练习成本,正在对美国此前宣布的5000亿美元AI基建计划形成巨大的打击。
分析师:英伟达的业绩指引很关键
1月26日(周日),拥有20年行业经验的数据分析师Itai Levitan在一篇题为《中国DeepSeek会推翻英伟达么?》的文章中称,英伟达即将发布的财报将极为重要,投资者应高度关注管理层的评论,尤其是关于AI领域的竞争风险;如果DeepSeek是一个真实的要挟,那么其可能会出现在英伟达的业绩指引或财报中,尤其是在其 数据中心 领域。Itai Levitan认为,衡量DeepSeek影响的最佳方法便是观察英伟达后续的股票价格。
Itai Levitan指出,如果把英伟达比作iPhone的话,那么DeepSeek便是“廉价智能手机”。在智能手机行业,廉价替代品的出现无疑改变了苹果的市场份额,尤其是在新兴市场,这同样适用于英伟达。不过,这决定于DeepSeek能否复制英伟达的生态系统,还是仅仅在价格和性能上展开竞争。
对此,1月25日,摩根大通分析师Joshua Meyers在标题为《通过DeepSeek的叙述思考——风险是真实的么?》的研报中写道,虽然目前还不清楚DeepSeek在多大水平上利用了High-Flyer的约50k hopper GPU(与OpenAI据信正在训练GPT-5的集群规模类似),但似乎很有可能的是,他们正在大幅下降成本(例如,其V2模型的推理成本据称是GPT-4 Turbo的1/7)。DeepSeek推翻性的主张是“更多的投资其实其实不等于更多的创新”,这一主张开始在美国AI领域引引关注。
不过,在Joshua Meyers看来,这(DeepSeek的低成本)其实其实不意味着(AI领域)扩张的终结,也不意味着不再需要更多的算力,更不意味着投入最多资金的一方不会获胜(24日扎克伯格还大幅提高了Meta 人工智能 的资本支出)。相反,这似乎将强逼我国的竞争对手提高效率:“DeepSeek-V2能够达到令人难以置信的练习效率,在所需算力只有Meta的Llama 3 70B 1/5的情景下,其性能比其它开源模型更好。另外,DeepSeek-V2训练所需的算力是GPT-4的1/20,而性能却相差不大。”如果DeepSeek能够降低推理成本,那么其它公司也将不得不效仿。
AMD火速“站台”,美国私募:DeepSeek或改写GPU市场格局
就在1月25日(周六),英伟达的“老对手”AMD还火速为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上,并借助SGLang进行了性能优化。此次集成将助力加速前沿 人工智能 应用与体验的开发。
1月21日,美国私人投资基金Noah's Arc Capital Management发文称,DeepSeek-V3模型的突破明显降低了AI培训成本,使AMD GPU成为比英伟达更具有成本效益的替代品,增强了AMD的市场地位。在DeepSeek-V3开发的关键阶段,利用AMD ROCm软件和AMD Instinct GPU加速器,进一步巩固了与AMD的长期合作。
AMD还表示,将继续基于AMD Instinct GPU上基于CK-tile的内核,对DeepSeek-V3的性能进行优化。AMD Instinct是AMD的 数据中心 GPU品牌。Instinct产品线面向的是加速深度学习、人工神经网络和高性能计算/GPGPU应用。
Noah's Arc Capital Management认为,AMD今年(2025年)每股收益预计为4.99美元,这一预期处于AMD历史预期PE区间的低端。市场预计AMD盈利增长将远远慢于其规模更大的竞争对手英伟达,尽管AMD在GPU市场还没有达到规模。
另外,AMD曾屡次上调2024年AI GPU的销售指引,将预测从20亿美元提高到50亿美元。这表明AMD在不断增长的AI GPU市场中的地位正在加速提升。虽然AMD的传统业务(即CPU和GPU)仍然拖累着公司估值,但Noah's Arc Capital Management认为,随着更多轻量级的大模型训练和推理集群的建立,这个核心AI GPU业务部分将在未来5到十年内非常有价值:“DeepSeek的确改变了GPU集群的设置方式,AMD应该从中受益。”
Noah's Arc Capital Management还指出,DeepSeek证明,不再需要最卓越的芯片来训练大模型,“DeepSeek-V3模型是在英伟达H800上训练的,这是英伟达为中国客户定制的速度较慢的GPU。然而,AMD的MI 300X GPU在关键基准测试中表现优于H100。因此,DeepSeek可以在AMD GPU上支持最卓越的模型训练。”
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核对。据此操作,风险自担。