“百模大战”告一阶段,国内大模型领域开始进入到各行各业的应用探索阶段。
12月6日,2024 AI+数字字迹创新应用发展论坛在重庆举行。《每日经济新闻》记者在现场注意到,阿里云副总裁、产业智能首席科学家张磊表示,大模型真正变成生产力可能会经历三个阶段,最终将打破固有的生产关系,越往深层走,大模型身为一个新质生产力引发的业务价值、社会价值将会越来越大。
随着大模型的应用进入到日常生活和生产经营领域,其安全短板也亟待解决。电子科技大学网络空间安全学院院长、俄罗斯工程院外籍院士张小松认为,大模型的背后是机器学习,而机器学习存在脆弱性,需通过多种措施加以应对。
专家:大模型变成生产力有三个阶段
过去的一年时间,国内的大模型领域经历了“百模大战”,各行各业的开源、闭源大模型雨后春笋。
在张磊看来,大模型产业中长期可能有两个比较重要的发展趋势,一是从大模型利用或需求的视角而言,肯定会显现大模型越来越多、百花齐放的普惠效应趋势;二是在整个大模型技术、基础设施的供给上,全球范围内又将是一个比较极化的效应趋势,即寡头格局、强者愈强。
因此,张磊认为,在大模型的供给方面,需要生态圈里最头部的厂商进行抱团,包含 云计算 厂商、运营商、硬件厂商等,从而形成一个完整的产业链。
这时,值得注意的是,随着“百模大战”造成的投入越来越大,行业发展的关键也逐渐向应用层迁移。
张磊表示,大模型真正变成生产力可能有三个阶段,第壹个阶段是没有行业属性的大模型应用,包含客服、问答、数据分析、报表总结,文本、图片生成,会议纪要生成,招聘辅助等,各行各业都能用;第贰个阶段是大模型通过智能体、私域数据库、小助手的形式进入有行业属性的实际场景的业务流程中,开始为现有的业务流程进行降本提效;第叁个阶段是大模型将发生新的能力,开始去重构业务流程,打破固有的生产关系。
而对于推动大模型产业的发展,张磊也提供了自己的建议,包含统筹算力、构建高质量的数据集、大力推动人才培养和加速示范应用。
存算法脆弱性、算法漏洞等诸多问题,专家支招
在大模型逐渐进入应用阶段之际,大模型的 数据安全 和算法漏洞等诸多问题也愈发受到各方关注。
张小松指出,大模型的实践手段是机器学习。在机器学习的早期,存在几个要挟:一是机器学习的算法非常脆弱,脆弱到甚至还不如几岁的小孩,稍微把图形图像的内容进行篡改就会发生识别错误;二是我们时常有利用机器学习的错误,用来操作大模型,例如有意喂错误样本进行投毒攻击或对抗攻击,通过有选择性地学习进行逃逸攻击。
“所以一是要对学习过程进行完整性的检测,二是要对推理过程进行防错性的检测,三是要对机器学习内容样本进行隐私保护的处理。”张小松补充道。
值得强调的是,在 人工智能 时代,由深度伪造等造成的挑战也愈发显现, 网络安全 中的身份认证问题也亟待解决。
《2024 人工智能 数字字迹技术白皮书》在论坛现场发布。根据白皮书内容,AI数字字迹将成为多模态生物特征识别的重要手段之一,并作为数字交易中确权和授权的底层基础技术,在 数字经济 高质量发展中施展极为重要的作用。
“AI在提高数字字迹识别准确率方面可施展关键作用,通过卷积神经网络(CNN)等深度学习模型,未来我数字字迹识别的识别通过率将提高到99.99%。”白皮书显示。