从ChatGPT到Sora, 人工智能 及大模型已成为引领这一轮科技革命和产业变革的战略性技术。今年政府工作报告提到了3次“ 人工智能 ”和26次“安全”,提出要大力推进现代化产业体系建设,加快发展新质生产力,并强调要深化 大数据 、 人工智能 等研发应用,开展“ 人工智能 +”行动,缔造具有国际竞争力的数字产业集群。
“ 人工智能 ”也是今年两会代表委员们热议的关键词。南都记者统计发现,来自通信、互联网、数字人等领域的多位两会代表委员,从人才培养、算力与数据开放共享、 数据安全 与合规、大模型垂直应用场景开发等角度,提出了多项关于 人工智能 发展的建议。
聚焦1:培养人才
普及更多学段,强化AI应用型团队建设
代表委员们围绕 人工智能 发展的人才问题建言献策,将 人工智能 教育普及到更多学段、加强应用型人才建设、加强高校相关学科建设等建议被多位代表反复提及。
其中,在将 人工智能 教育拓展到更多学段方面,全国人大代表、小米集团老总兼总裁雷军提出,建议从义务教育阶段普及 人工智能 素养教育。“建议将 人工智能 素养教育并入九年义务教育内容,设置 人工智能 通识课程,同时将相关内容并入中小学社会实践活动。从基础理念到简单应用,全面激发中小同学的兴趣,培养中小学生对 人工智能 的认知能力和应用能力,为未来发展打下坚实基础!”
全国人大代表、 科大讯飞 老总刘庆峰也建议,加快推广大模型赋能全学段,以全新机制加快探索我国 人工智能 拔尖创新人才培养。他的建议还包含加快运用大模型的现有能力,缔造教师和同学的助手,赋能从中小学到 职业教育 和大学的教育教学提质增效。
加强 人工智能 应用型人才团队建设也被多位代表反复提及。在 人工智能 快速向各行业领域延展渗透之时,对人才技能升级的要求较高,而许多企业也成了该领域的重要推动力量,拥有大量的数据资源和强大的计算资源和丰富的应用场景,但这时,社会人才市场却严重缺乏高水平的 人工智能 培训能力。
对此,雷军建议支持大型科技企业和教培机构培育 人工智能 应用型人才。“建议鼓励大型科技企业和社会教培机构开展 人工智能 应用型人才培训,以适应 人工智能 领域技术快速迭代、人才需求量大、应用广泛的特征。具体来看,可结合 人工智能 人才的供需情况,通过配套政策引导,鼓励企业和机构灵活设置从 人工智能 基础素质培训,到尖端前沿 人工智能 人才的系统性培养,有效满足当前各领域对 人工智能 应用型需求。”
刘庆峰也建议,要研究通用 人工智能 时代人才能力素质模型和培养方案,加快应用型人才培养。另外,刘庆峰还表示,针对未来可能被 人工智能 大量替代的行业和岗位,要针对劳动力培养及再就业做专项研究,并且提前、主动做好应对。同时,还要关注通用 人工智能 对社会各行业造成的冲击,加快建设新的人才能力素质模型和课程培养体系,尤其是加快用通用 人工智能 赋能软件代码、语言学习、艺术创意等应用型人才的培养,助力我国软件行业和 数字经济 发展。
根据教育部公布的数据,目前,我国498所高校开设了“ 人工智能 ”本科专业,209所高校成功备案或申报“智能科学与技术”本科专业,在全国3000多所高校中占比仍然较低,强化 人工智能 学科建设仍是行业人才培养的发力重点。
基于此,雷军还建议,加大对高校 人工智能 学科建设的投入,通过加强与世界一流科研机构的合作交流,从海外弓进优秀师资力量,吸引企业顶级人才和行业专家进入高校授课等方式,扩大教学力量。将 人工智能 通识课程拓展到更多专业,如传统理工科专业,医学、金融、文史、艺术类等专业,培养更多跨领域人才。引导 人工智能 赛道的大型公司向高校学生开放实习实践机会,提升理论与实践相融合的综合素质。
针对人才培养,全国人大代表,中国铁塔党委书记、老总张志勇也建议,要加快 人工智能 人才的培养和储蓄,有条件的地区试点“人才特区”等政策,缔造企业、人才集聚的 人工智能 创新高地。刘庆峰也持有类似的建议,他表示应设立国家 人工智能 学院,以“核心+基地”的组织形式和全新机制推动我国面对中美竞争的拔尖 人工智能 人才培养。
聚焦2:降低算力成本
建立算力、数据资源公共调度平台
大模型浪潮下,AI发展的三驾马车算力、算法、数据的任何一个维度都被两会代表委员高度关注。更庞大的数据量、更高的数据质量能推动大模型有更好的练习与应用效果,但数据与算力总是有限的。今年,政府工作报告中第壹次提到“大力推动数据开发开放和流通使用”,并强调要适度超前建设数字基础设施,加快形成全国一体化算力体系,体现对 数字经济 发展的积极引导。
对此,很多两会代表委员提出,要增进算力与数据等资源的协同共享。全国人大代表,中国铁塔党委书记、老总张志勇提议,一是要缔造 人工智能 创新开放体系,开放算力平台、共性技术平台、行业训练数据集、仿真训练平台等 人工智能 基础设施;二是要缔造协同创新的 人工智能 产业发展联合体,开源平台和开源生态,增进破除商业化禁用限制,进一步降低算力成本,使大模型的使用“普惠化”。他还表示,应建立算力资源公共调度平台,增进算力资源协同共享,提升算力资源运用效能。
张志勇还提议,需要提升行业数据供给水平、引导行业龙头企业开放非敏感数据。“我建议制定统一标准的数据架构,鼓励各类企业建设高水平行业数据集,强化行业数据流通交易,建立多类多模态新型公共数据集,增强高质量数据供给;制定数据开放相关政策,引导行业龙头企业开放非敏感数据,全面加强数据资源开发利用水平,让数据‘供得出’‘流得动’‘用得好’,为行业大模型成长提供充分‘养料’。”
无独有偶,全国人大代表、 科大讯飞 老总刘庆峰也围绕训练数据共享开放方面,建议推动国家级高质量训练数据开放和共享,支持国家实验室、全国重点实验室、国家 人工智能 开放创新平台等国家战略科技力量以揭榜挂帅形式优先、低成本使用。
全国政协委员、知乎开创人、总裁周源也提议,应加快高质量中文数据集的开发与利用。在周源看来,数据作为新型生产要素已经成为驱动全球 数字经济 的动力引擎,我国 数据要素 市场起步较晚,标准、权属、交易、商业模式、监管等相关环节还有待完善。
要提升大模型训练数据的质量,周源认为需要加快构建标准统一、布局合理、管理协同、安全可靠的公共 大数据 资源体系。“当前,我国已经开始全面部署和推行公共数据开放制度,但公共数据开放仍旧存在数据开放利用不充分、不协同、不平衡、不可持续等诸多问题,加快构建标准统一、布局合理、管理协同、安全可靠的公共 大数据 资源体系,有助于大模型训练数据质量提升。”周源表示。
聚焦3:立法监管
保障 数据安全 与数据合规
随同ChatGPT、Sora等大模型应用的走红,来自 人工智能 安全方面的要挟也在显现。近期,利用 人工智能 应用进行诈骗、换脸变声等安全事件已屡见不鲜。
奇安信老总齐向东在今年两会接受采访时就表示, 人工智能 的源头是 大数据 ,要先解决 数据安全 才能解决 人工智能 安全。同时,数据合规也应该被监管职能部门看见和重视。今年,多位两会代表委员针对 数据安全 、数据合规议题提出立法与监管方面的切实需求。
在全国政协委员、知乎开创人、总裁周源看来,当前,大模型服务提供者获取训练数据的渠道大体可以分为经授权获取数据,如采购第叁方数据库等,和自行收集数据,如通过网络爬虫等技术手段收集数据等。在后者情境下,涉及多种 知识产权 客体,存在侵犯他人享有权益的内容的表现,有比较大的法律风险。另外,根据Epoch AI 人工智能 预测组织的研究报告显示,AI公司可能在2026年前耗尽高质量文本训练数据。
在此情境下,周源建议从监管层面采取严厉责罚与鼓励并行的形式,强化 数据安全 和 知识产权 的保障措施。“建议监管职能部门和相关机构研究制定相应的管理办法或法律法规,一是推动大模型研发机构和企业制定严格的保护政策和行为规范,严厉惩戒侵权行为发生,确保数据持有方的 知识产权 和利益得到充分保护;另一是制定相应的鼓励和扶持政策,保障拥有丰富高质量数据储蓄及持续生产能力的企业和社会主体得到整个行业的注意,增进 数据要素 市场的形成和生产能力的持续发展。”
在数据合规方面,周源表示,大模型训练高度依赖高质量数据,没有好的数据就不会有好的模型。随着大模型技术的深度发展,他建议相关政府部门和监管机构针对数据合规应建立相应的监察管理制度,推动完善AIGC监管立法,保护和规范 人工智能 领域的数据合规。对大模型的数据收集来源、处理方法、合规性等进行监督和审查。周源还表示,应加强对大模型的社会影响和风险评估,及时发现和解决可能存在的问题。
张志勇提议,要加强模型的 数据安全 。好比加快推进 人工智能 立法,出台暂行办法保障大模型安全发展;同时要构建行业大模型内生安全体系,建立全面的软硬件安全、 网络安全 、 数据安全 、模型算法可信增强、个人信息保护的立体化安全保证体系。
刘庆峰也建议,应加速通用 人工智能 技术相关的法律法规制定与审议。“围绕大模型的 数据安全 、隐私泄露、可靠性、 知识产权 等几大关键方面制定法律法规,提升通用 人工智能 技术可靠性与规范性。同时,完善向社会开放的大模型的准入和运行规则,明确责任分配与问责机制,并明确大模型 知识产权 与保护方式。”
聚焦4:创新应用场景
推动大模型垂直化、产业化落地
在全国政协委员、360集团开创人周鸿祎看来,2024年是大模型应用场景元年,中国完全可以走出一条具有中国特色的大模型发展之路。
因此在其2024年两会提案中,周鸿祎建议要深化 人工智能 多场景应用,支持大模型向垂直化、产业化方向发展,助力加快形成新质生产力。他从场景、知识、业务融合三方面提出了建议。
“一是场景很关键,大模型在垂直领域大有可为,建议政府、央国企率先提供更多应用场景,聚焦‘小切口,大纵深’,推动大模型垂直化、产业化落地。二是知识很关键,基于‘暗知识’的垂直大模型能更好解决企业问题,建议鼓励企业在定制AI前,做好知识管理,将企业 大数据 平台升级为企业知识平台。三是业务融合很关键,建议鼓励和引导企业将大模型与数字化业务系统深度结合,同业务流程相结合,充分施展大模型价值。”
同样关注 人工智能 应用场景的还有全国政协委员、 天娱数科 副总经理、山西数据流量谷老总贺晗。他向南都记者表示,加快拓展 人工智能 大模型技术应用场景有着迫切的必要性,“一是因为大模型目前在传媒、金融等行业应用的多,其它行业有案例但不多更谈不上普及,推动大模型技术与制造业、能源、交通等更广泛的行业应用相结合,对于整个经济体降本提质增效有帮助;二是进程中还会发生新的业态,好比AI助教、AI诊断等,这是新的增长点;三是来自产业应用中的反馈反过来也会大模型技术创新有帮助。”
腾讯混元AI生成图片
为此,他提出了两方面的建议,一是鼓励搭建多条理应用场景供需对接平台。“我建议鼓励地方政府、领军企业、行业协会和专业服务机构搭全国级、地方级、行业级等多条理 人工智能 大模型技术应用场景供需对接平台,同时我也建议推动具有首创性、示范性的标杆场景项目落地,缔造标杆性大模型产品和服务。”
其次,应在全国范围实施大模型赋能千行百业示范应用推进计划。“我建议鼓励工业、金融、商务、交通、医药、政务、教育、文旅、传媒等各行业各领域深度挖掘、积极缔造可应用 人工智能 大模型技术的各类场景,推动大模型赋能产业互联网平台应用,通过大模型技术对现有生产、服务和管理方式进行升级,实现业务流程创新和再造。”
张志勇也提到,应加快创新应用场景建设,施展我国应用场景丰富的优势,强化企业主导的产学研深度融合。“好比可以在国家统筹部署下,引导企业开放应用场景;举办基于生产场景应用的 人工智能 算法大赛,加快资本、人才、技术、数据、算力等要素汇聚;进一步强化多模态、多场景、多任务的行业大模型 人工智能 技术研发,增进科技成果转化,推动大模型在行业应用中不断提升能力。”