“我们积累了很多数据,这些数据很有商业价值,有人上门寻求合作,但我们比较谨慎,一直没有对外合作。”一位大型互联网公司员工表示,“现在政府在大力推动 数据要素 市场,国有平台可能会率先突破”。
直到今天,今年已经有 江苏省 数据局、 四川省 数据局、 广东省 政务服务和数据管理局、 天津市 数据局等10个数据主管部门正式挂牌。
去年10月份国家数据局正式揭牌,在此前后,多省市数据管理机构相继挂牌,政策条文和管理机构都已成型。
政策推动数据市场的力度不断扩大。不过,关于这个市场仍然有很多疑问,诸如数据资产大户心理状态谨慎、数据权属有疑问、入表缺少实践、数据如何流通和交易如何定价等。
谨慎
人们的衣食住行生老病死和各种交易,都会发生数据,这些数据盘活起来,可以推动效率提升,成为数据资产。
“我们的顾客有许多是世界500强,这些企业会生产出很多数据,好比客户购物数据等,他们委托我们对数据进行加工,加工之后,这些数据才会施展作用。”一家从事数据处理的上市公司职员表示,“好比销售数据交给我们,我们经过分析,对平台上的商户很有用,这些商户可以根据这些数据进行有针对性的宣传广告投放,让投放更有效率。”
这已经是比较成熟的模式。在国家提出要建立 数据要素 市场之前,这个市场早就存在,从数据生产、搜集、加工、销售到存储都有专业公司。
“不过这个市场也有不规范的地方,一些数据来源不明,每年都有因此而进入监狱的。”上述职员表示。
这也是数据市场的困扰之一,有大量涉及个人隐私的黑产存在。一些头部企业可能挖掘了数据潜力,但也有可能不精确,好比在某个平台搜索并下单了某产品,在其它网络还会碰到该平台投放的相同商品广告,这就造成了浪费。一些头部企业拥有大量个人信息,但很难将这些个人信息提取出来,好比社交媒体广告其实不精确,需要依赖用户反馈作出调整。
有媒体透露,2018年初腾讯总办会上,公司总裁刘炽平提出一个数据共享计划,通过搭建一个中台集中资源来提升腾讯的算法能力、商业化能力等。字节跳动被认为是将这套体系施展得最为极致的企业。腾讯数据精华主要在微信。不过与会者最终认为这个事涉及 数据安全 ,有潜在风险。
这牵涉到数据到底归谁所有的问题。曾经有一个公司在后台更改用户贮存的资料,引起轩然大波。一般而言,用户拥有数据隐私。很多平台在用户刷脸时都会调用身份信息,可是这些信息其实不归平台所有,用户消费会在购物网站留下记录,用户在某个平台上流传分享沟通信息,也会留下记录,但这些记录都涉及隐私。平台可以掌握用户各种信息,可是这些信息是否能用来商业开发,这一点其实不明确。
“我们对此很谨慎,大平台做事情第壹要合规,宁可走得慢一点。”上述大型互联网公司员工表示。
价值
除了个人和企业数据,还有一种是公共数据,行政机关和事业单位、公共事业国企等公共机构在履行职责或提供公共服务都会发生数据。好比人口统计、各种经济数据、公立医院的病例数据、地铁客流量数据、民政局的结婚离婚数据...。
目前,地方政府在试探此类数据商业化的存在性。去年年末,湖南衡阳就试图拍卖当地政务数据资产的独家使用权。
当地负责此项业务的职员表示,他们探索 数据要素 资产商业化已经有3年时间,主要客户是到当地开拓市场的商业机构,尤其是银行、保险等金融机构。
“我们开发了几十个产品,包含交通类的、医疗类的、金融类的,针对某些金融机构开发出风控模型和基础模型,可以给这些金融机构引流,新增贷款,控制不良率,我们可以用对赌的形式来收费。”该职员表示。
记者了解到,当地政务数据主要来源于地方国土资源局、房产部门、法院、工商、交通、民政等系统,可以查询客户名下是否有车辆,是否有违法记录,查询公积金、 养老金 、银行借款、罚款记录等,如果要做抵押贷款,不用再去国土资源局等相关部门查询,只用网上登记就可以评估贷款。
金融机构愿意使用这些数据,是因为可以减少调查成本,减少坏账。该职员举例,有地方金融机构坏账率原来位居全省前列,现在大幅下降超过九成,因此这些金融机构愿意以新增贷款的千分之二到千分之三支付费用。一些原来单个机构掌握的数据,因为交叉共享,也变得非常快捷高效。
在这个进程中,政府会将数据脱敏,保护客户隐私,只会给出计算结果。
对于衡阳数据资产挂牌底价18.02亿元人民币。上述职员解释,这是25年时间的运营权,是根据未来收益法进行评估。据介绍,已经有同类城市实现了协议转让,有一个地方人口和面积只有衡阳一半,30年数据运营权的价钱是38亿元;另外一个城市经济总量和衡阳相差不大,十年数据运营权价格为19.8亿元人民币。
记者了解到,当地政府并没有将独家运营权交给外来主体,而是转让给当地的国资平台。通过转让,地方会多出一份不菲的资产。
这么做的政策依据主要是2022年年底出台的《中共中央国务院关于构建数据基础制度更好施展 数据要素 作用的意见》(业内称“数据20条”),和去年8月财政部发布《企业数据资源相关会计处理暂行规定》明确数据资源的确认范围和会计处理适用准则。
财政部文件确认数据可以作为资产入表,地方国资平台是企业运营,入表后就可以增加地方政府净资产。
这也让地方政府增加了化债手段。这是土地财富之外的一个新增量,提高了地方政府化解债务风险的能力。
不过,衡阳当地最终取消了公开招标,职员称接到上级通知,上级肯定了当地的做法,可是希望更稳妥推进此事。
脱敏
“数据20条”指出,对数据的利用,要以维护国家 数据安全 、保护个人信息和商业秘密为前提,尤其对于公共数据,要在保护个人隐私和确保公共安全的条件下加以利用。
脱敏是在 数据要素 话题中被频繁提到的关键词,就是在保护隐私的情景下开发商业价值。一位从业者表示,微信个人信息要保护,但某条图文下的点赞量基本上可以做到脱敏。脱敏是削减掉用户的个人信息,调取某个群体的共性。
北京市 京师(上海)律师事务所 数字经济 中心主任杨振律师分析,数据的原始形式表现为客观事物未经处理和简化的直接记录,在人们无意识的表现活动中发生。对于这些原始数据提供者而言,作出浏览、关注、点赞、转发之类行为的难度极低,分摊到每单位数据上的成本也可以忽略不计,并且在这一进程中只是生产出了作为行为附属品的分散数据,它们的使用价值其实不高;再加上这些数据其实不是严格意义上由生产性劳动所创造,因而它们也不具有价值。而原始数据在经过收集、聚合、加工等处理流程后,其可用性大幅提升,演化为能够施展经济创收的数据资源。
数据脱敏是数据处理进程中的一项技术手段,能够有效规避敏感信息泄露、被窃取、被滥用所造成的不利后果,保障 数据安全 合规的高效利用和流通。目前,最为常见的隐私计算技术,就是在不袒露数据本身的条件下,实现数据的共享、互通、计算,最终发生超出数据本身的价值,保障数据在流通融合进程中的“可用不可见”。
入表
在 数字经济 时代,数据已成为继土地、劳动力、资本、技术之外的第五种“生产要素”。随着 数据要素 市场不断推进,围绕数据资产化的探索明显提速。
数据资产入表是个很关键的历史变化。业内对此看法众多,有一种典型看法是,如果数据并表而没有应用,那就只是增加了资产而已,对应可能还会增加负债。有用的数据要能发生价值,包含自家生产和对外采购,都需要有 知识产权 ,方可以进行售卖,如果通过研发形成数据产品而有人买单,也可以形成资本摊销。在其它场景可重复利用、可变现的数据才有价值。
杨振律师表示, 数据要素 具有规模酬劳递增、非竞争性、低成本复用等特点,具有强大的乘数效应,能够赋能经济社会诸多领域。国家数据局前一段时期发布了《“ 数据要素 ×”三年行动计划(2024-2026)征求建议稿》,从其中重点提及领域亦可一窥端倪。
目前来看,有商业潜力的领域主要包含:智能制造、 智慧农业 、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、 智慧城市 、绿色低碳等。
中国电子商会秘书长彭李辉预计,“十四五”期间,我国 数据要素 市场规模复合增速将超过25%,到2025年规模有望接近2000亿元人民币。
数据要素 市场主要由供给方、需求方、服务方、监管方组成。数据供给主要包含政府为主的公共数据、企业数据和个人数据三大类,供给方需为交易标的物质量及合规性负责,中间服务方包含运营方和第叁方服务商,可提供技术及流通服务,包含算法、算力服务等,帮助供需两侧做好数据产品的加工等。
关于数据资产纠纷,历史上比较有代表性的案例有“大众点评诉百度地图案”、“微博诉脉脉案”、“腾讯诉搜道公司、聚客通公司案”和“蚂蚁金服诉企查查案”等。
杨振律师认为,因为当前我国尚未在立法层面形成专门的企业数据保护机制,司法实践中对于企业数据权益的保护存在不同观点和路径选择。而在众多典型案例中,甭管是当事人还是司法机关,在处理数据权益类纠纷时均倾向于援引《反不正当竞争法》的有关规定处理相关纠纷案件。相关争议点主要聚焦于诉争数据的权益基础确定和认定被诉数据使用行为具有不正当性的界定标准。