商业洞察

【大模型】商汤智研院田丰 -人工智能+-,下一代世界科创中心战略-踏脚石-

查看信息来源】   3-25 5:42:44  

  通常认为,当一个国家的科研成果超过全世界总数的25%,就可称之为世界科学中心。公元1000年,世界科技创新的中心在中国。之后,包含文艺复兴时期的意大利(14世纪—16世纪)、工业革命时期的英国(18世纪)与法国(19世纪)、第贰次工业革命时期的德国(19世纪)、信息革命时期的美国(20世纪—21世纪),逐渐成为新的世界科学中心。每个国家的科学兴盛期大致为60年至1十年,平均约80年。而且,随同科学、技术、经济、文化一体化融合的历史趋势,世界科学中心有较大概率成长为世界经济中心、世界金融中心、世界贸易中心、世界航运中心。

「人才第壹」

  投资界将估值超过10亿美元的科创公司称为“ 独角兽 ”。报告显示,全球40%的科创 独角兽 位于美国的三个区域:旧金山湾区(26%),纽约(8%),洛杉矶(6%)。最近三年,欧洲 独角兽 数量提升很快。其中,伦敦的 独角兽 数量翻了一番,并继续成为欧洲的主要科技产业城市;巴黎和柏林是欧洲新一代 独角兽 的两大孵化土壤。从 独角兽 总市值的视角来比较,美国第壹,中国第贰,欧洲第叁。其中,北京和上海约占中国 独角兽 总市值的三分之二(64%)。

  当前,生成式 人工智能 (GenAI)尚处于产业变革的早期阶段。但旧金山湾区的GenAI 独角兽 市值已占到全美的81%,这与当地科创产业密度正相关,就像纽约是金融科技(FinTech)与加密货币(Crypto) 独角兽 的沃土那样。作为中国科创中心发展的比较研究对象,旧金山湾区甚至纽约有以下几个要点经验值得借鉴:

  第壹, 人工智能 的跃升、科创中心的发展依赖当地高校输送人才,需要建立更多的科技公司,构建多条理、丰富的人才供给与需求市场。

  在旧金山湾区,涉及 人工智能 精湛的顶尖高校和名师是源源不断输送人才的“发动机”。其中,斯坦福大学、加州大学伯克利分校、加州理工学院、圣何塞州立大学、圣克拉拉大学、旧金山大学、卡内基梅隆大学硅谷校区、加州大学旧金山分校、加州州立大学东湾分校、加州州立大学圣马特奥分校等,拥有全球顶尖的 人工智能 专家和科技企业家校友网络。

  据《旧金山纪事报》报道,仅在2023年7月至10月就有579家公司发布了1958个 人工智能 岗位。其中,59%的招聘职位来自旧金山湾区的科技公司,既有谷歌、苹果、英伟达等大型公司,也包含Adept AI、Notion等创业组织。而且,旧金山湾区的 人工智能 工程师招聘岗位平均工资比其它地区高出21%。

  好比,OpenAI人均年薪86万美元,新人起薪即为Google Research的1.6倍;另一家创业公司Anthropic的招聘起薪相当于微软实验室的近2倍,且避免使用短时间绩效目标来干扰基础科研创新。以科技人员时薪为标准,美国排名前十位的城市都在加州(旧金山湾区范围内)。因此,这一区域吸引到了来自亚洲、欧洲的大批科研人才。

  第贰,通过法律保障人才在科技巨头、科研团队、草创企业之间流动。

  好比,雇主不得设立“竞业协议”这一举措在增进人才流动的条件上,有力地加速了科研经验知识的扩散流传,激发创新创业潜能,增强市场竞争活力,避免形成垄断,进而提高行业整体效率,减少法律纠纷与运营成本,建立健康的行业生态,增进前沿技术组合式创新。

  加州大学伯克利分校教授安纳李·萨克森尼安在《区域优势:硅谷与128号公路的文化和竞争》一书中提出,波士顿地区的科技产业逐渐消亡,原因之一就是工程师一生只在一家企业工作;硅谷之所以蓬勃发展,一个重要因素是湾区员工经常跳槽到另一家公司甚至开办新公司来跟老东家竞争。

  加州是美国最早立法禁止“竞业协议”的地方(1872年),所以才从肖克利半导体诞生了“仙童八叛逆”和英特尔等,通过“Paypal帮”建立了Tesla、SpaceX、LinkedIn、YouTube等知名科技企业。2023年1月,美国联邦贸易委员会进一步发布声明,拟在全国范围内禁止用人单位与雇员签订竞业禁止性条款。

  第叁,基础科研人才与应用型开发人才比例均衡。

  数据显示,在 人工智能 领域,美国23%的人才从事基础科研,40%的人才从事应用产品开发;而在中国,只有3%的人才从事基础科研,65%的人才从事应用开发。同时,中国是全球最大的 人工智能 人才培养和输出国,有两个“1/3”的数字来证明:世界顶级 人工智能 会议发表论文的作者中,中国人占1/3;中国 人工智能 科研人才,有1/3在美国工作。

  培育、吸引和储蓄基础科研人才,是新一代 人工智能 科技取得突破的前提条件。中国人很擅长做 人工智能 科研,实施人才“归巢”计划刻不容缓。可从现在开始,以特殊津贴吸引、保障、安置相关的科学家、工程师归国或来华。

  第四,依靠“精英领军”配套工程化小团队,助力新一代 人工智能 一日千里。

  以OpenAI为例,Sora团队仅有15人,领军人物有2人(其中一人博士结业才一年),平均年龄约30岁,华人科研人员占比20%;Dall-E团队共14人,华人科研人员占比57%;ChatGPT团队共87人,平均年龄32岁,华人科研人员占比10%。

  OpenAI科学家出版的《为啥伟大不能被计划》一书提出,创造力是一种“搜索”。科研就是在人类未知领域中深入搜索,找到看似与最终目标不相关的“踏脚石”,进而离正确答案越来越近——新奇事物的重要性在于,它们往往可以成为“踏脚石”探测器。因为任何新奇的东西,都是催生更新奇事物的“踏脚石”。

  实践反复证明,鼓励科研人员大胆去探索“踏脚石”,才可能开辟全新的存在性。钱学森很早就提出,正确的结果,是从超多错误中得出来的;没有超多错误作台阶,也就登不上最后正确结果的高座。如何让 人工智能 基础科研人才“不害怕失败”“敢于疑问、敢于挑战权威、不断探索未知”,是构建新一代 人工智能 科研机制不应回避的命题。

  

「未来之路」

  1956年,钱学森在《从飞机、导弹说到生产过程的自动化》中写道:“用机器取代人的体力劳动,是第壹次工业革命,即机械化;用机械系统来替人作非创造性的脑力劳动,是第贰次工业革命,即自动化。”之后,他在20世纪80年代又屡次强调,“21世纪,务必要攻下 人工智能 、第五代计算机的关,我们的做法要有中国特色”,要更加重视独立自主,“就像原子弹、氢弹、洲际导弹一样,在智能机方面,务必要下苦功夫建立自己的条件”。

  立足新时代新征程,习主席深刻指出, 人工智能 是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。加快发展新一代 人工智能 是我们赢得全球科技竞争主动权的重要战略抓手,是推动科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。西方国家通过前几次工业革命赢得了300年的经济红利。如果中国能够抓住 人工智能 这个新一代科技的“牛鼻子”,缔造具有国际竞争力的数字产业集群,就能为14亿多人赢得未来300年的经济与产业战略机遇。

  科技是第壹生产力,人才是第壹资源,创新是第壹动力。上海在 人工智能 人才培养上投入巨大,显现供需两旺特征:从供给侧来看,如旧金山湾区一样,上海交通大学、同济大学等至少9所高校开设了 人工智能 学科专业,其中有6所单独建立了 人工智能 研究院所;从需求侧来看,根据《上海“十四五”产业人才需求调研报告》预测, 人工智能 应用类人才(13.8万至15万)、 人工智能 基础类人才(10.2万至13.1万)需求最大。

  未来几年,上海 人工智能 产业的人才需求总规模应在34.3万至41.4万人之间。尤其是,在 传感器 与智能芯片人才、知识图谱与自然语言处理人才、服务 机器人 人才、智能网联汽车类人才子类上,还面临较大的人才缺口。建议借鉴相关经验,深化拓展学术界、工业界与全球伙伴的联系网络等,以“实现更好的公私合作协同增效”“扩大与更多不同利益相关者的合作伙伴关系”“完善、扩大和建立研发伙伴关系机制”。

  Sora是OpenAI信仰的“标准定律”的又一次成功验证。2020年,OpenAI正式提出“随着训练数据集、训练算力、模型参数量持续增加,语言模型性能持续提高,为了获得最佳性能,所有三个因素务必同时放大”。这一科学规律已经被逐步验证,世界各国的 人工智能 发展应该都会沿着这条路径走下去。

  从算力发展策略来看,应加速国产化 人工智能 芯片的研发进程,以补助型芯片、补助型能源供给推动超大规模智算中心扩容,以跟上国际可靠的大模型所需的算力规模。

  美国根据“算力常胜”战略,即充分施展GPU芯片算力优势与全球互联网数据规模,不断训练更大参数量的大模型,从千亿、万亿向数十万亿参数规模发展。最近,英伟达又发布了新一代GPU芯片GB200,是H100算力的6倍,而H100算力是A100算力的3倍。以目前国产GPU对标A100的现状来看,美国在 人工智能 的算力方面已取得长足进展。我国的科研工作者务必摸索出一条独特的 人工智能 发展路径,即在 人工智能 算力只有美国1/20的条件下实现更好的科研目标与模型效果突破。

  到2025年,中国芯片自给率计划要达到70%的发展目标。上海具有良好的芯片与算力产业基础,浦东新区的智能芯片产品设计、闵行区的芯片生产制造、临港新片区的超级智算中心正在加速满足快速增长的国产化需求。下一步,有必要降低 国产芯片 采购成本,以临港超大规模智算中心等为基础,参考光伏、 新能源 车等产业扶持政策,对建设方、使用方实施长期补助,以用促研,推动普惠算力,释放应用开发者、科技草创团队的创新潜力。

  在 人工智能 领域,还有一个趋势值得高度关注。2023年,中国以训练算力为主(58.7%),推理算力为辅(41.3%);但有预测显示,中国在2024年的推理算力将达到67.7%,反超AI训练算力(32.3%)。这一信号表明,我国的“AI2.0版”商业应用将大量涌现。更便宜的算力价格,对应用开发、应用运营将有更明显的帮助。

  从训练数据发展策略来看,中国数据资源潜力巨大,要“让数据供得出、流得动、用得好”,有力支撑新一代 人工智能 技术的可持续发展。

  比较而言,中国拥有比美国更大规模的数据发生“源头”,14亿多人口、106亿终端设备每天都在源源不断发生增量数据;而美国3.3亿人口、35亿终端设备略逊一筹。如果能够持续降低 传感器 成本、数据收集与标注成本,在上海率先落地数据开放、共享、流通、交易模式,可以让长三角甚至全国的数据真正成为 人工智能 的催化剂和生产要素。

  但也要看到,据OpenAI预判,“从长远来看,人类引发的数据可能会变得不足”。因此,中美两国都在积极支持合成数据研发,以逐步发生新的高质量数据源。何为合成数据研发?打个比方,假设地球上所有人每天发生100万亿个词,而OpenAI每天发生超过1000亿个词,即已达到1%的内容产出。凭借 人工智能 技术和算力的指数级发展,到2030年合成数据将取代真实数据用于 人工智能 训练。

  从模型发展策略来看,大模型科研是长期重资本投入,且有庞大的未知领域需要探索,多模态大模型、端侧大模型、模型安全技术已成为 人工智能 发展的三大趋势。

  Sora之后,“集成了文本、语音和视频等各种形式的多模态AI,结合广泛可用的视频等数据集,不断生成新颖的视频内容,预计将出现重大飞跃”。任何“创造性”都是对过去发生的事情加上一个“误差项”的一种重新组合,乘以“反馈循环的质量”和“迭代次数”。有人提出应该最大化“误差项”,其实诀窍在于最大化其它两个因素。

  这在实践中都有好的案例。好比,基于上海 人工智能 实验室与众多高校合作开展的科学研究,新一代 人工智能 基础理论、基础软件、基础硬件、核心技术、开放平台和应用均得到了不同水平的进展。在最新发布的开源大模型排行榜上,上海的“书生·浦语2.0”取得第壹名,在综合能力、推理能力、数学能力、编程能力等方面超过了三个国外可靠的开源大模型。又如,基于上海的条件设施和技术积淀,从开源和闭源两条路径快速迭代升级基础模型能力,推出语言大模型、绘画大模型、数字人视频生成大模型、3D空间建模大模型、3D小物体建模大模型、辅助医疗大模型、辅助编程大模型等。

  总之, 人工智能 作为上海三大先导产业之一,具有人才、算力、模型研发、数据四大先发优势。凭借 智慧城市 、智慧产业、智慧科研场景中海量设备收集的超模态数据,国产大模型正在驱动千行百业加快形成新质生产力。尤其是“ 人工智能 +”制造业、服务业、科研、基建四大板块,是我们独有的全工业品类、大服务市场、广谱基础科研、重投入基建优势领域,是新一代 人工智能 高质量发展的主攻方向。未来之路上, 人工智能 计算什么不是最重要的,控制什么可能更为重要。能解决实际问题的科研,就是“国之重器”。

  (作者:商汤科技智能产业研究院院长田丰)

繁体中文