微众银行李辉忠:区块链+隐私计算,构建“数据新基建”的信任基础 | 巴比特学院第17期公开课
2020年4月,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》出台,该文件首次把数据与土地、劳动力、资本、技术一起纳入生产要素范畴。
文件提出要加快培育数据要素市场,比如推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护。
从业者相信:一个新的、数据的时代到来了。站在数据新时代的门口,创业的机会和挑战在哪里?
12月30日晚上8点,巴比特学院第17期公开课正式开课,主讲嘉宾微众银行区块链底层平台研发负责人李辉忠以《区块链+隐私计算助力数据要素价值挖掘》为主题进行分享。
区块链如何融合隐私计算,助力挖掘“数据要素”的价值?以下内容来自直播分享,经巴比特整理。
大家好,我的分享提纲主要分4个部分。
1、数据要素的独特属性。
2、挖掘数据价值存在的多维挑战。
3、区块链+隐私计算技术助力数据价值挖掘的新思路。
4、关于数据新基建的畅想。
新数字经济时代的数据之道:从买卖关系变为租赁关系
从农业时代、工业时代到数字时代,随着文明的变迁,生产要素也在改变。
农业时代,土地和劳动力是主要生产要素;工业时代,资本和技术是主要生产要素;数字时代,数据成为最重要的发挥生产力价值的主要生产要素。
相比传统生产要素,数据作为生产要素具有独特属性。
数据具有易复制性,一份数据可以给多方使用。
数据具有价值聚合性和多样性,比如我们在使用不同软件和服务时,会留下一些个人数据,这些提供服务的机构存储了用户数据,但数据非常分散,并呈现出多样性特征,只有当这些数据聚合在一起,才能发挥更大的价值。
数据还具有价值认知多样性,同一份数据可能对一些机构来说价值非常大,对另一些机构则不一定有很高价值。
另外,相比传统生产要素,数据作为生产要素还具有另外一大特点——数据作为生产要素不再是简单的买卖关系,而是从买卖关系变为租赁关系。
传统的生产要素大多以买卖形式存在,在生产要素实现所有权、收益权转移之后,卖家通常无权继续干涉该生产要素。但数据作为生产要素,往往是以租赁形式存在,所有权可能仍归于数据的生产者或者数据的所有者,收益权则会在数据生产者和使用者之间进行“约定分配”。当这种租赁关系建立后,数据生产者仍然有权干涉或者说跟进数据是不是按照约定的要求被使用。
正因为数据具有这些独特属性,在挖掘数据价值方面,往往面临一些挑战。
挖掘数据价值存在多维挑战
从产品形态或技术形态上,我们整理了数据价值挖掘的整个运作流程,提炼出数据价值挖掘的“双循环”。
第一个循环发生在个人和机构间,主要指个人授权机构收集个人数据后,机构对个人数据信息的收集、存储、使用、加工、传输、提供、公开等。
第二个循环发生在机构与机构的数据协同,涉及多方数据的传输、存储、计算、联合建模等。
数据价值挖掘的第一个挑战来自法律法规。
以电商购物为例,电商平台通过数据可以推断用户位置、个人喜好、收入水平,甚至包括健康状况、社交关系、兴趣爱好等。
显然,很多人会介意这些信息被违规使用。过去一段时间,个人信息数据保护相关的法律法规密集颁布,他们都要求机构必须依法、合理、有效的利用数据,保证数据有序流动的同时保护个人的数据隐私。
因此从数据应用的角度看,数据价值挖掘的第一个挑战来自法律法规,要求能兼顾数据流动及隐私保护的平衡,合规为本。
数据价值挖掘的第二个挑战则来自用户。
现实生活中我想你一定听过大数据杀熟、暴力催收等。为什么会出现这种问题?因为在传统的数据运用中,存在数据越权收集,数据被过度使用,甚至被非法转让。
在用户层面,大家已经开始意识到数据隐私保护的重要性,并对数据应用提出新的期望——有贴心服务与放心体验,保证服务的高效与安全。
这是数据价值挖掘面临的第二个挑战。
隐私保护:通过技术去建立数据所有者和使用者之间的信任关系
《个人金融信息保护技术规范》中定义的隐私数据生命周期,包括收集、传输、存储、使用、删除、销毁等环节。每个环节都涉及到了关于数据的安全和隐私问题,比如收集时如何安全授权,匿名、加噪采集,存储时如何安全存储、防止信息泄漏等。
对隐私保护理解的一些误区
那么数据隐私保护可以用什么技术实现呢?我觉得目前存在一些理解误区。
数据加密 ≠ 隐私保护
权限控制 ≠ 隐私保护
信息安全 ≠ 隐私保护
零知识证明 ≠ 隐私保护
可信执行环境 ≠ 隐私保护
数据不出库 ≠ 隐私保护
比如零知识证明不完全等于隐私保护,零知识证明解决的是如何在一些场景下不透露数据的同时能做一些证明,但数据要素的价值挖掘场景中会涉及到数据的计算,证明并不等于计算。
再比如可信执行环境,依赖于你要相信提供可信执行环境的硬件环境,你必须得相信硬件的服务,所以也不等于隐私保护。
为什么存在这些理解误区?因为隐私保护不是一种单一的技术,隐私保护包括数据确权机制、授权机制、密文存储、密文计算等,涉及到一系列的技术组合,它通过技术去建立数据所有者和使用者之间的信任关系。
区块链与隐私计算相辅相成,构建起分布式信任机制
实现数据隐私保护,核心要建立起数据使用者和数据所有者之间的信任关系。
怎么做?我们认为,区块链+隐私计算,搭建基于区块链的分布式信任机制,这可能会是一种好的解决方案。
区块链方面,由区块链把数据上链,从而多方建立一个联合参与共识的场景;加上密码学算法,实现链上数据难篡改、可追溯,进而实现数据的安全存储和转移;再基于智能合约等做一些数据的治理和审计,由此支撑分布式的商业模式。
隐私计算方面,我们提出了基于场景优化的隐私计算方案,相比传统的、通用的隐私计算解决方案,更高效、更实用。
区块链技术注重多方参与,隐私计算注重在多方参与过程中保护用户的数据,隐藏掉一些信息,实现信息最小化披露。看起来区块链和隐私计算存在一些矛盾,实际上二者共同点非常多,结合在一起可以达到相辅相成的效果。
区块链可以为隐私保护增强它的安全和透明度,隐私计算为区块链增强合规,扩大协作度,从而非常好地去挖掘在分布式场景下的数据要素的价值。
区块链+隐私计算,构建“数据新基建”时代的信任基础
最近,微众银行区块链发布了“数据新基建”白皮书,全面论述了微众银行“数据新基建”的具体方案及应用案例,助力释放数据生产力。
该方案融合微众银行人工智能、区块链、云计算、大数据四大基础能力,解决释放数据生产力过程中的三个核心技术问题:安全存储、可信传输和协同生产,从而实现数据要素价值挖掘的四大难题,即产权可界定、价值可存储、价值可评估、价值可流通,最终进一步释放数据的生产力。
我们在区块链+隐私计算方向其实做了非常多的探索,这里是一个综合的微众银行区块链在这方面的能力版图。最底层是微众银行联合金链盟开源工作组打造的国产开源联盟链底层平台FISCO BCOS,中间件平台是WeBASE,它可以让用户简单便捷地快速使用区块链,上层我们提供了诸多组件,其中就包括WeDPR数据隐私保护组件,再往上就是刚才提到的基于场景化的隐私计算的方案。
多种基础能力综合在一起,为数据新基建里数据的价值挖掘提供能力。
我今天的分享主要是这些了,谢谢大家。