安全、成本和计算复杂度正在制约 数据要素 价值的进一步施展,如何让数据价值像水电一样即开即用,自主创新技术是破局手段之一。
在第七届数字中国建设峰会期间,国内 数据安全 、数据流通领域的多家市场机构集中披露了一系列增进数据可信流通的前沿技术和产业实践。
蚂蚁集团副总裁、首席技术安全官韦韬在峰会期间接受《中国经营报》记者采访时表示,未来 数据要素 在流通进程中需要全新的技术标准与技术方法体系,密态计算作为下一代隐私计算技术体系,可以提供数据可信流通全流程保障。他透露,蚂蚁集团将在今年推出密态计算云服务平台,进一步提高性能降低成本,推动数据大规模可信流通。
规模化数据可信流通面临瓶颈
数据要素 化环境下,增进数据合规高效流通成为各界共识,但 数据要素 化后造成的流通风险也在引起行业重视。
IBM最新调研报告《2023年度数据泄露成本站告》显示,2023年数据泄露的平均总成本达到445万美元,创历史新高。另外,只有三分之一的企业能通过自己的安全团队发现数据泄露,而82%的泄露涉及存储在云环境中的数据。
“数据跨域流转进程中,会经历一系列复杂的加工链条,其间存在大量泄露与滥用风险。”韦韬表示,“好比终端被入侵,和运维人员、研发人员利用架构权限获取额外信息,甚至内部的人盗用等,与其它要素相比,数据更容易被拷贝、分割、篡改、扩散,很多数据源方不敢把数据拿出去让外部加工。”
而由此也造成数据拥有者不愿意和不敢进行数据流通。“经济上,非法二次分发后,会造成数据价值迅速贬值;风险上,明文数据流通中风险成本呈指数级增加,迅速超过流通收益,合规压力巨大。”韦韬对记者说。
其实,近年来,隐私计算等方式已经在探索数据可用不可见、可控可计量上实现了一系列突破性探索,但技术在发展进程中也正在遭遇业务性能和业务界限上的瓶颈。
蚂蚁集团隐私计算部隐语总经理王磊向记者表示:“前期的隐私计算随着业务发展逐步袒露出了两方面问题。第壹,一般都是点对点的数据融合操作,受限于网络带宽和延迟的制约,计算规模和性能天花板较低,不能支撑大规模的数据可信流通。第贰,隐私计算解决的主要问题是围绕计算进程中的安全性,但数据可信流通需要对数据的全链路和全生命周期的安全可信进行管控,除了计算过程的安全性外,还会包含密态数据研发、密态数据交付、全链路存证审计等全流程的能力。”
这也造成机构探索技术突破口时,一方面,需要用可信硬件,精密计算来保障技术性能、降低 数据安全 成本。另一方面,需要技术能够覆盖解决数据加工、存储、计算、研发加工、标准化治理、运营交付等全环节。
价值开发与成本可控如何平衡?
支持大规模的数据可信流通,技术的高性能和低成本必不可少。其中,高性能决定了技术是否能对业务发生增量价值,而低成本则可以实现让大部分机构都能够承担,降低技术门槛。
记者了解到,近年来包含蚂蚁集团在内的多家科技公司和银行等金融机构大力布局隐私计算技术。但受到来自合规、业务效果、成本等多方面原因影响,在全市场数据流通不畅的环境下,这一技术也需要寻找可持续的商业空间。
隐私计算使用成本之所以高,是由于技术路线繁多。王磊对记者说,每条技术路线都有相应的优缺点和适应的场景。不一样的场景需要用不一样的技术路线、不一样的框架,这造成切换成本很高。
其实,这也让很多机构不愿意投入巨大成原本保证 数据安全 ,而一旦发觉问题后补救又往往意味着更大的投入。
蚂蚁集团自2016年起重点布局隐私计算技术及规模化应用实践。“此前隐语的突破口是用一套统一的架构,把这些技术路线全部集成,可以实现一套框架适用不一样的场景。”王磊表示。
在业务增量价值上,隐私计算在 新能源 车险和农户贷款等场景获得了一点可量化的业务效果。
好比在车险领域,此前由于该垂类数据积累不足, 新能源 车车企定价上面非常被动,为了保证定价不至于亏损,通常会把定价定得偏高。据王磊透露,在安全汇聚多方数据的进程中,通过隐私计算技术来实现更精确的定价。在隐语落地的十多家保险公司中, 新能源 车险平均保费降低了8%。目前这个场景正在快速铺开。
不过隐私计算想创造规模化、可持续的商业空间,则需要进一步提高性能和降低门槛。
韦韬就透露:“我们选择的形式是进一步聚焦推动数据跨云跨端的低成本流通,接着将通过推出密态计算云服务平台,围绕数据流转全链路提供数据密算服务,降低企业使用隐私计算服务的门槛和成本,打开产业协作空间。”
“根据美国成熟使用 网络安全 险的市场数据测算,为安全风险保障投入成本控制在整个数据流通价值的5%以内时,相关方就有动力来进行投入。”韦韬表示。
这也是支撑密态计算云服务走向市场的底层逻辑。
王磊向记者透露,密态计算云服务作为下一代隐私计算技术,在跨域能力、数据流通周期覆盖上和易用性上都上了一个台阶。在重要的性能和成本问题上,我们希望通过软硬结合的形式,把密态计算的成本缩小至明文计算的2—10倍,性能能够迫近明文计算的1/2—1/10。
在成本压缩方式上,王磊进一步向记者解释,密态计算一定是有成本的,但成本需要可控。数据有不同样的价值,根据数据价值和风险的储蓄,可以通过不一样的密态技术去对应不同价值的数据,实现综合的成本平衡。
其实,近年来国际上在降低数据流通成本方面也已经有了新模式。据韦韬透露,美国在数据流通中已经开始出现“ 数据安全 险”( 网络安全 险下项目)——由保险公司对交付平台的安全性进行监督审查,降低赔付风险。如果出现相关数据滥用问题,意味着交付平台要对应更昂贵的保费。
在他看来,通过这种方式可以把数据利益对齐,对业务价值和风险实现综合考虑。