安大互联
  • 1
  • 2
  • 3
  • 4
  • 5
商业热点 > 商业洞察 > DeepSeek发文!首次披露关键信息

【DeepSeek】DeepSeek发文!首次披露关键信息

查看信息来源】   发布日期:3-1 15:24:13    文章分类:商业洞察   
专题:DeepSeek】 【成本利润率】 【GPU

  3月1日中午,DeepSeek在知乎平台发布首条文章,公布模型推理成本利润细节,并披露成本利润率关键信息。DeepSeek称,假定GPU租赁成本为2美元/小时,总成本为87072美元/天……统计包含网页、App和API在内的所有负载,如果所有tokens全部根据DeepSeek-R1的定价计算,理论上一天的总收入为562027美元,成本利润率为545%。

  文章一经发出,很多网友纷纷在评论区@尤洋。尤洋是潞晨科技开创人。此前,尤洋公开表示,卖DeepSeek API(MaaS)每月亏本4亿元人民币。该消息一度引起轰动。目前,尤洋已回应称,“由于多人at我,我今天(3月1日)之内会直接地回复一下”。

  理论上一天的成本利润率为545%

  文章中,DeepSeek第壹次披露成本利润率关键信息。DeepSeek统计了在24小时统计时段内DeepSeek-V3和R1网页、App和API的所有负载,所有tokens根据DeepSeek-R1的定价,并假定GPU租赁成本为2美元/小时,总成本为87072美元一天。DeepSeek称理论上一天的成本利润率为545%。

  其中,DeepSeek称,在最近的24小时里(北京时间2025/02/27 12:00至2025/02/28 12:00),DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点。DeepSeek-R1的定价为0.14美元/百万输入tokens(缓存命中),0.55美元/百万输入tokens(缓存未命中),2.19美元/百万输出tokens。

  DeepSeek补充到,当然公司实际上没有这么多收入,因为V3的定价更低,同时收费服务只占了一部分,另外夜间还会有折扣。

  DeepSeek表示,DeepSeek-V3/R1推理全面的优化目标是:更大的吞吐,更低的延迟。文章主要内容为如何使用EP(大规模跨节点专家并行)增大batch size(批量大小,每个batch中的样本数量),如何隐藏传输的耗时,如何进行负载均衡。

  不贴钱,也不赚取暴利

  此前,尤洋称,卖DeepSeek API(MaaS)每月亏本4亿元人民币。该消息引起人们对于DeepSeek盈利话题的热议。

  尤洋称,DeepSeek API(MaaS)根据2025年2月初的状态不会盈利。亏损来源一是测试速度和实际场景的差距,二是机器利用率峰值和波谷的巨大差距,三是机器的不稳定性。

  DeepSeek在最新文章中表示,白天高负荷时全节点部署推理,夜间低负荷时释放节点用于训练/研究。全天峰值278节点,平均226.75节点。业内人士表示,这疑似回应疑问,DeepSeek文章内容证明资源弹性伸缩有效,避免了资源长期空置。

  关于盈利话题,DeepSeek开创人梁文锋曾公开表示,“我们只是根据自己的步伐来做事,然后核算成本定价。我们的准则是不贴钱,也不赚取暴利。这个价格也是在成本之上稍微有点利润。”

  去年5月,当时担任DeepSeek员工的罗福莉在知乎透露称,“大家不用担忧模型断更,也不用担忧API涨价(目前就是大规模服务的价钱,不亏本,利润率超50%)”。

  “这篇文章估计今年会被做在线推理和私有化部署的群转爆,因为大伙可以看到他们踩的坑和让出的 利润。”业内人士表示,“其实这个钱不好赚的,除非能够持续地吸引用户都来用一方的API ,持续进化模型,保持领先。”

  同时,在部分业内人士看来, 人工智能 领域的 利润其实其实不是只考虑技术能力,商务付费能力和应用场景也极为关键。

  开源周收官

  这时,DeepSeek刚结束为期5天的“开源周”。

  2月28日,“开源周”第五天,DeepSeek宣布开源Fire-Flyer文件系统(3FS),和基于3FS的数据处理框架Smallpond。Fire-Flyer文件系统(3FS)是一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,是所有DeepSeek数据访问的助推器。

  此前,DeepSeek宣布,从2月24日起将开源5个代码库,以完全透明的形式与全球开发者社区分享他们的研究进展。

  2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,目前已经投入生产使用。

  2月25日,DeepSeek开源了DeepEP。据介绍,这是首个用于MoE模型训练和推理的开源EP通信库,用于训练和推理的高吞吐量和低延迟。

  2月26日,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的练习和推理提供强大支持等。

  2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题。

  QuestMobile数据显示,自上线以来至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万个。

  “开源技术正从代码共享迈向实体创新,成为推动智能将来的关键力量。开源硬件为技术创新提供了自由与灵活性,而中国开源生态的发展,如DeepSeek的成功,展现了开源从‘运营驱动’向‘价值驱动’的转变。”上海开源信息技术协会秘书长朱其罡称。

手机扫码浏览该文章
 ● 相关商业动态
 ● 相关商业热点
人工智能】  【DeepSeek】  【周鸿祎】  【有法可依】  【新能源汽车】  【高质量发展】  【机器人】  【AI换脸拟声】  【自动驾驶】 
  • 客服与业务咨询

   【网络建设服务报价】