商业洞察

【DeepSeek】胡泳 - DeepSeek给我们带来怎样的世界？

【查看信息来源】 2-11 19:10:47

　　中国人工智能实验室DeepSeek推出的人工智能语言模型R1堪称一场地震。它在所有应用商店榜单上超越了美国的竞争对手ChatGPT，触发科技股市高达1万亿美元的抛售，并在硅谷引发末日般的评论。

　　美国知名风险投资家马克·安德森（Marc Andreessen）将R1的发布誉为全球人工智能发展竞赛中的“斯普特尼克时刻”（Sputnik moment），比肩当年苏联通过发射卫星而令冷战对手美国震惊的历史性事件。

　　对美国人的震惊有多大呢？英伟达，作为为AI模型提供支持的领先计算机芯片制造商，股票价格狂跌17%，市值蒸发近6000亿美元，下下跌幅度度创美国股市最高纪录。谷歌母公司损失了1000亿美元，微软损失了70亿美元。美国总统唐纳德·特朗普表示，DeepSeek应该成为“美国行业的警钟，我们需要全力以赴，专注于竞争以取得胜利”。

　　根据DeepSeek的说法，其R1模型在“各种基准测试”中表现优于OpenAI的o1-mini模型，而Artificial Analysis的研究表明，R1模型在整体质量方面也超越了谷歌、Meta和Anthropic开发的模型。

　　业界的震动不仅源于质量的高低，还在于DeepSeek声称仅花费不到600万美元就训练出了一款可与ChatGPT媲美的人工智能模型。相比之下，OpenAI的主要合作伙伴微软计划今年在人工智能基础设施上投入约800亿美元。

　　DeepSeek拿出的，不只是“我国的ChatGPT”, 还代表着中国对OpenAI的回应，R1的影响要大得多，原因有几个方面。

　　思维链模型：推理飞跃

　　首先，它是一种“思维链”模型，这意味着当你给它一个查询时，它会通过自我推理来给出答案：这种技巧看似容易，但极大地提高了回答质量。

　　反复测试表明，DeepSeek-R1在解决数学和科学问题方面的能力与OpenAI于2024年9月在旧金山发布的o1模型相当，而后者的推理模型被认为是行业领先者。

　　OpenAI当时表示，o1的工作方式比以前的大语言模型（LLM）更接近人类的思维方式。“在回答之前进行思考，先生成一条长长的内部思维链再响应用户”, 这是OpenAI对其自身创作的描述。

　　在此方面，R1不仅可以直接与o1进行比较，还增强了自身回答数学和编程问题的能力——这些问题在AI专家中被高度重视。不仅如此，R1的能力不限于数字和代码，它在语言处理和自然语言推理任务中的表现也令人印象深刻，这意味着其高效的要领适用于更广泛的应用，而不只是结构化问题求解。

　　另外，R1还更具可访问性。它不仅通过应用程序免费提供使用（而OpenAI的o1则需要每月支付20美元），而且对于开发者而言，完全免费，可以下载并集成到他们的业务中。例如，基于其出色的性能和低成本，R1将鼓励更多科学家在日常研究中尝试使用大语言模型，而无需担忧成本问题。

　　除了低成本，R1的开放性可能会给科学研究造成推翻性的变化：通过其应用程序接口（API），科研人员仅花费专有模型成本的一小部分即可使用该模型，或通过在线聊天机器人 DeepThink免费查询。另外，他们还可以将该模型下载到自己的服务器上，免费运行并在此基础上进行开发——这是像o1这样的封闭模型所无法实现的。

　　从人工智能研究的视角而言，DeepSeek展示了一种改进无数其它模型的要领。它通过使模型构建变得更便宜、更快速、更易于获取，代表了全球AI的重大进展。虽然LLM其实其实不是通向先进AI的唯一途径，但DeepSeek的创新当得起“AI里程碑”的美誉。

　　Anthropic的联合开创人杰克·克拉克（Jack Clark）表示，该公司的模型Claude也受到启发。

　　“现在互联网上出现了一个开放权重的模型，任何足够强大的条件模型都能通过它引导成为一个AI推理器，”

　　克拉克在他的新闻简报Import AI中写道：

　　“全球的AI能力刚刚实现了一次不可逆的进步。”

　　Anthropic另一位联合开创人达里奥·阿莫迪（Dario Amodei）则撰文表示，这背后是范式的改变。

　　“每隔一段时期，正在扩展的条件事物会发生一些变化，或在训练进程中加入一种新的扩展方式。从2020年到2023年，主要的扩展内容是预训练模型：这些模型通过大量的互联网文本训练，并在其基础上进行少量额外的练习。而在2024年，使用强化学习（RL）来训练模型生成思维链的思路，成了扩展的一个新重点。这个新范式的特点是，首先使用普通类型的预训练模型，然后在第贰阶段通过RL增加推理能力。”

　　DeepSeek在构建其R1模型时的重大创新是摒弃了人工反馈，设计算法来识别并纠正自身的错误。科研人员写道：

　　“DeepSeekR1-Zero展示了自我验证、反思和生成长链推理等能力……值得注意的是，这是第壹次通过强化学习验证大规模语言模型的推理能力可以仅通过这种方式进行激励。”

　　总之，DeepSeek卓越的推理能力、创新的练习方法和对可访问性的承诺，为人工智能的发展树立了新的标准。阿莫迪特别提到：

　　“我怀疑R1引起如此多关注的主要因素之一在于，它是第壹个向用户展示模型推理过程（链式推理）的模型，而OpenAI的o1仅向用户展示最终答案。DeepSeek证明了用户对这一点感兴趣。”

　　他认为，这只是一个用户界面设计的决策，与模型本身无关。

　　然而，所有这些因素使得R1的表现更容易被人们欣赏，就像2022年ChatGPT的聊天界面第壹次使人工智能变得触手可及一样。

　　挑战硅谷现成叙事推翻AI发展方式

　　其次，R1的建立方法削弱了硅谷当前的AI发展方式。美国主导的形式是通过简单地增加更多的数据和计算能力来扩展现有模型，以实现更高的性能。这种方法造成了该行业能源需求的巨大增加，并使科技公司与政客紧密相连。开发AI的款项如此庞大，以至于科技公司希望借助国家来融资和兴建基础设施，而政客则希望购买它们的忠诚，并在支持高速增长的企业方面表现积极。

　　一个典型的案例就是特朗普在1月早些时候宣布的5000亿美元“星际之门”（Stargate）计划，号称“历史上最大的人工智能基础设施项目”——一个由OpenAI、甲骨文和软银联合投资的合资项目，旨在在全美范围内建立数据中心网络，目标是建设支持人工智能开发所需的关键数据中心和计算基础设施。

　　然而，在R1问世之后，特朗普说他始终在“阅读有关中国DeepSeek”及其公司的内容，尤其是一家提出了“更快且更低成本的人工智能方法”的企业。“这很好，因为你不用花费那么多钱。我将其视为一种积极的因素，一种资产，”特朗普表示。

　　市场对旧AI发展方式受到的冲击反应迅速且猛烈。《金融时报》报道称，对冲基金Elliott Management在一份致投资人的公告中表示，人工智能被“过度炒作”，而作为这一热潮的大赢家之一的英伟达正处于一个“泡沫”之中。

　　作为主导AI行业的芯片供货商，人们把英伟达与19世纪加利福尼亚淘金热时期的“铁锹和水桶商”作比较，因为它恰好在金矿高潮中出现，成为全球最富有行业的主要供货商。然而随着DeepSeek的崛起，科技公司可能会开始疑问是否还需要像以前那样大量购买英伟达的工具。

　　从长远来看，AI领域的新竞争者对英伟达而言，会是个好消息么？其它公司在AI军备竞赛中投入的计算能力是否代表了浪费的钱财？通过开发出一个与美国同行相匹敌、在许多方面超越它们的AI模型，DeepSeek挑战了硅谷的故事，即技术创新需要庞大的资源和最小的监察管理。

　　DeepSeek做了啥是财力雄厚的OpenAI没有做到的呢？很难确定答案，因为OpenAI对其GPT-o1模型的练习过程一直非常保密。不过，两家公司在方法上的一些明显不同，和DeepSeek似乎在某些领域取得的令人印象深刻的突破，都值得关注。可能最大的不同，也是造成像英伟达这样的芯片制造商股票狂跌的原因，在于DeepSeek能以远高于其规模对手的效率创造出竞争模型。

　　OpenAI能否转向高效？完全可以。但其与微软的合作伙伴关系和问题重重的领导结构可能使这种转变昂贵得多。这家公司深度整合了微软的Azure基础设施，曾经看似是战略优势，不过现在看起来越来越像一种负担。虽然OpenAI始终在推动客户转向微软庞大的数据中心，但市场正在发现一条不同的道路：高效的开源AI模型，可以在明显更便宜的条件设施上运行。

　　OpenAI的形式与新兴的轻量级、可访问AI之间的鲜明对照使得该公司面临一个特别艰难的格局。它的整个商业模式，建立在高昂定价和假设先进AI需要云计算和庞大数据中心的条件下，正在受到竞争者的挑战，后者通过更加精简的操作获得了大致十分的结果。

　　近年来，OpenAI通过将现有的机器学习算法扩展到空前绝后的规模，在语言处理领域实现了一系列鹤立鸡群的突破。其GPT-4可能是通过使用数万亿单词的文本和数千个强大的计算芯片进行训练的，整个过程耗资超过1亿美元。

　　然而，早在2023年4月，公司总裁山姆· 阿尔特曼（Sam Altman）就表示，进一步的进展不会来自于模型规模的继续扩大。

　　“我认为，我们已经到了这个巨型模型时代的尽头，我们会以其它方式改进它们。”

　　此声明表明，GPT-4或许是OpenAI通过扩大模型规模并输入更多数据这一策略所引发的最后一次重大进展。当时，阿尔特曼并未说明将取而代之的研究策略或技术可能是啥。在描述GPT-4的论文中，OpenAI表示，其估算结果显示，扩大模型规模的回报出现递减。阿尔特曼还说，公司能够建设数据中心的数量和建设速度也存在物理限制。

　　不过这并无妨碍包含Anthropic、AI21、Cohere和Character.AI在内的很多资金充裕的草创公司，投入巨大的资源，致力于构建越来越大的算法，试图赶上OpenAI的技术。直到DeepSeek出现的时刻。

　　R1推翻了“扩展是前进之路”的普遍认知。据认为，R1的开发成本比OpenAI的o1便宜95%，而且仅使用了Meta的Llama 3.1模型十分之一的计算能力。能够以极小的预算实现等效的性能，才是R1令人震惊之处，这也是它发布后发生巨大影响的原因。这表明，美国公司可能在浪费资金，且更灵活的竞争者能够击败它们。

　　DeepSeek粉碎了“AI霸主地位需要亿万美元支票”的神话。更进一步地，DeepSeek的发展引发了对AI基础设施（如芯片）重大投资必要性的疑惑，并对美国科技公司在AI领域的市场领先地位发生了影响，这可能会对美国科技行业的估值施加压力。

　　美国投资银行高盛的数据分析师在2024年6月发布了一份题为《生成式AI：过多的支出，过少的利润？》的报告，敲响了AI投资的警钟。该报告疑问未来几年内对AI的1万亿美元投资是否“值得”，并表达了对投资回报的担忧，而这种担忧现在被DeepSeek的案例所加剧。

　　如同Forrester的数据分析师所说。DeepSeek刚刚“打开”了AI投资回报的路径。由于精妙的优化，训练模型的成本壁垒大幅下降，预计这些优化方法将被全球的模型开发者复制并改进。

　　短时间来看，这对英伟达来说是个坏消息，因为它将抑制需求。然而，从长远来看，较低的成本（和因此而降低的能耗）将为更多的草创企业和企业提供建立模型的机会，从而增加整体需求。这进一步验证了一个事实：仅依靠提供核心AI基础模型的供货商是不够的，此一推翻性转变将进一步打开AI模型市场的大门。对于技术领导者而言，这应该是一个强烈的信号，要求他们认真审视对AI领域几个大玩家的过度依赖。

　　AI应该人人能负担并可获取

　　所有这一切都意味着R1发布的确切影响是无法预测的。涉及的因素太虚无缥缈，未知数太多，无法确定未来会怎样。然而，这并没有阻止科技界和市场的疯狂反应，总裁们惊慌失措，股票价格狂跌，分析师们急忙修正行业预测。而这实际上正展示了AI领域的特点：它布满了热度、不确定性和过度反应。

　　可以明确的是，实现下一个条理的人工智能仍然需要大量的计算资源。推动我们迈向下一个里程碑的因素硬是不确定——是规模、数据、微调、强化学习，还是完全不同的其它因素。DeepSeek目前代表了我们所知道的最先进技术，但它其实其实不是下一个条理的人工智能。

　　不过我们仍然可以断言：DeepSeek R1代表了人工智能发展中的一个重要里程碑。AI行业现在正处于十字路口：通往AI主导地位的道路可能不再是由庞大的数据中心和巨额预算铺就，而是通过优雅的算法和无情的高效性，最终将人工智能从象牙塔带入到大众手中。

　　在接受中国媒体采访时，梁文锋表示：“AI应该是人人都能负担得起并可获取的。”这一点，就是DeepSeek的最大意义之所在。

● 相关商业动态

【软银集团】三季度业绩超预期亏损 -钱荒-下软银继续押宝OpenAI

【DeepSeek】DeepSeek热度狂飙，相关概念股股价疯涨后，多家上市公司提示-影响有限-

【青云科技】靠DeepSeek-一夜暴富-！青云科技4年累亏近8亿，遭两大股东高位减持套现

【DeepSeek】国产手机集体接入DeepSeek，AI手机再度翻红？

【GDP】标兵渐远、追兵渐近，南京如何动起来？-DeepSeek之问

【阿里巴巴】苹果牵手阿里发力AI手机分析师 - 或引入更多大模型服务商