DeepSeek风暴席卷全球,印度人也在狂喜。但这不只是因为印度人喜欢用它。
据彭博社报道,自1月20日DeepSeek-R1模型正式发布以来,DeepSeek仅18天内累计下载量已突破1600万次,其中,印度下载量占所有平台下载总量的15.6%,成为DeepSeek新客户增长的最大来源。
分析认为,这反映出新兴市场对智能工具的旺盛需求——印度作为全球增长最快的电话端市场,其用户更倾向于尝试高性价比的AI工具。并且,这一现象也成功印证了“AI应用下沉”趋势,即技术普惠造成的市场扩张效应。
更关键的是,DeepSeek让印度人看到了一线曙光——在 人工智能 领域,别的国家也有机会。
受此启发,印度政府表示,计划在未来10个月内开发本土大语言模型,挑战DeepSeek与OpenAI。
“我 国发射月球任务的成本只有别的国家的一小部分。为啥我们不能也建立一个低成本的AI模型?”2月5日,印度信息技术部长阿什维尼·维什瑙与到此访问OpenAI的联合开创人兼总裁奥特曼会面。维什瑙说, 人工智能 的发展可以在世界任何地方落地生根。
就在上周,维什瑙赞美中国 人工智能 草创公司DeepSeek以其低成本的 人工智能 助手,撼动了 人工智能 行业,并将这种节约的做法与印度政府建立本地化 人工智能 模型的努力相联系。
那么,印度若想创造出自己的 人工智能 模型,有可能么?
奥特曼被巴掌打脸
时间回到2023年6月,彼时,风头正盛的奥特曼在印度参加一场活动。有印度投资人问他:“一个拥有1000万美元预算的小而聪明的团队,是否可以在AI领域做出本质的成果?”
当时,奥特曼的回答是:“我会告诉你,想在训练基础模型方面与我们竞争,完全是没希望的。你能做的也就是尝试而已。我认为你不应该尝试。”
如今,这段视频被媒体和网友们挖出,并热烈讨论。
路透社称,来自我国的DeepSeek引发世界轰动后,奥特曼的这番言论也成了社交媒体上的焦点话题。法国企业家阿诺德·贝特朗不仅转发分享了这段视频,还重复写下了奥特曼的回答,并写道:“回想起来,这真是太滑稽了。”
法国企业家阿诺德·贝特朗的回应。(图源:社交媒体截图)
DeepSeek以相对低廉的练习成本和开源的部署方式,得到了世界AI产业界的极高评价,也让印度人看到了希望。
“有人疑问印度政府在AI方面的投资规模。你们瞧瞧DeepSeek做到了啥?仅用了550万美元,就开发出一个非常强大的模型。这就是头脑的力量。”维什瑙说。
目前,奥特曼访问印度时与维什瑙展开了一场对话,他也第壹次回应了当年那段视频和AI成本争议。
奥特曼改口强调,称他之前在视频里的话是被“断章取义”的。他认为印度会成为AI革命的领导者之一,因为他看到了“印度正在拥抱技术和构建整个AI生态方面所做的努力,是非常了不起的”。
至于研发成本,奥特曼认为:“对于AI的前沿性研究成本仍然会连续性呈指数级别上涨,当然,单位智能成本会在未来一年内下降大约10倍,这个数字要超过了摩尔定律,目前半导体行业每年的成本下降大约在50%。”
10个月内,能准备好么?
1月30日,维什瑙放出消息称,印度的大语言模型将在今年之内准备好。
维什瑙透露,随着基础工作已完成,印度政府目前正专注于缔造一个符合印度独特需求的 人工智能 系统。他还称,预计该模型将“在未来10个月内准备就绪”,其基础框架已经到位。
据印度媒体透露,印度政府已经批准了18项提案,旨在加速农业和气候变化等关键领域的AI解决方案落地。这些支持措施包含提供算力、数据和资金。
维什瑙还透露,预计到今年年底,将有6家主要开发商推出基础AI模型。为使相关开发更加“经济且易于获取”,印度政府将补助40%的计算成本,降低AI计算单元的平均费用,将目前每小时1.29美元的款项降到更低。
其实,近年来,印度政府在AI方面的投资并很多。
就在2023年,印度才成立国家级“印度AI使命”(India AI Mission)项目,旨在实现“让AI在印度扎根”和“让AI为印度服务”两大目标,预算达1037.192亿卢比(约合人民币86亿元)。
印度AI使命的负责部门(图源:该部门官方网站)
印度也努力成为世界可靠的 人工智能 中心。包含微软、英伟达、亚马逊在内的大型科技集团都有计划在印度投资数十亿美元,建设 云计算 和AI基础设施。印度本土的阿达尼集团和信实工业公司也正在进行大规模 数据中心 投资。
甚至连贝莱德这样的资产管理集团,也计划招募近1200人,扩大在印度的两个支持中心,并在该国搭建AI能力。
作为衡量AI算力的一个重要标志,在超大规模 数据中心 数量上,截至2023年,印度只有大约18个超大规模 数据中心 ,而我国的公开数据是有接近100个。差距背后,是支撑和维系 数据中心 运作的一系列配套设施,包含了电力、网络、冷却系统等。
对此,《日本经济新闻》称,印度显然仍有很大的发展空间。
印度还差什么
近期,印度媒体和专家们不断在讨论,印度离一个本土的DeepSeek,还差些什么呢?
印度人认为,差距其实其实不是全面的。甚至在硬件方面,印度还有优势。
记者了解到,印度现有超过18600个高性能GPU,其中12896个为英伟达H100、1480个是英伟达H200、742个为MI325和MI325X。
相比较之下,DeepSeek是在2000个GPU上训练完成的,ChatGPT是在25000个GPU上训练完成的,因而印度有超过18000个高性能GPU,可以说,印度的算力资源已经足够强大了,足以支撑印度大模型的切实需求。
《经济时报》和《第壹邮报》还相信,印度在硬件和人力等软件资源上其实其实不逊于中美两国。但仍然没有在AI领域建立一个创新生态系统。
有学者认为,这与思维方式有关,印度其实其实不高度重视基础创新。
印度 数据中心 巨头Yotta的母公司总裁希兰南达尼认为,印度其实其实不缺乏先进芯片,“但我们还没有建立一个创新的生态系统,这是一个思维方式问题”。
印度前电子和信息技术部国务部长拉吉夫·陈德拉塞卡尔同样称:“DeepSeek AI模型的出现表明,印度的计算能力永远无法成为长期的护城河……希望印度的 人工智能 草创企业能够在未来造成推翻。”
印度专栏作家拉布罗也指出,印度应改变思维,敢于与世界领先企业竞争。“仅仅试图把别人创造的东西做好,其实其实不能让我们成为一个突破性的国家。我们需要投资于有助于自身利益的尖端研究。”
还有观点认为,印度政府干预的缺位和受保护市场的缺乏,也是印度企业怯于参与AI竞争的原因之一。
印度咨询公司Tracxn和印度 人工智能 协会的数据显示,过去4年,印度AI草创公司激增70家。但在AI大模型领域的企业不到10家,且业务主要聚焦在对话AI、智能助手等,基本不涉及基础模型的研发,只能解决相对初级的问题。
例如,印度 独角兽 公司Krutrim的自研模型Krutrim AI在使用时仅允许输入424个字符。而OpenAI的GPT-4,字符数上限已达到了32768个。
《第壹邮报》认为,印度政府干预并为企业建立一个“受保护的市场”极为重要。