隐私计算大爆发前夜,如何把握商机?丨世界区块链大会·武汉
12月5日,2020世界区块链大会·武汉正式在武汉国际会展中心开幕。大会由巴比特主办,并得到了武汉市政府、江汉区政府、武汉市经信局、中国信通院等部门单位的大力支持。
在当天下午举办的“联邦学习与隐私计算区块链的商业创新发展应用”圆桌论坛,蓝象智联CEO徐敏、洞见科技创始人、董事长姚明、微众银行系统架构师曾纪策、光之树副总裁武姗姗以及富数科技产品总监林琳,共同探讨联邦学习和隐私计算区块链的商业创新。
如何看待数据商业化和隐私之间的博弈和平衡?
徐敏:
数据隐私和数据商业价值是一对矛盾体,就像两个对面拍过来的海浪一样,它今天是互相冲向对方,不管浪多大,在下一秒就会融为一体一起往前走,我认为数据隐私和数据商业价值协同也是一样的,今天来看,如果要达到数据隐私保护和数据商业价值协同我认为有三个方面,包括人文、法律以及技术。人文,我们会更好地去达成一个个人享受更好的社会福利、社会服务,以及各种隐私保护之间的平衡点。法律方面是去确定数据的底线,人文和法律在一起,一个确定了上线,一个确定下线,而技术就是让我们更好地达成这个平衡点。今天我们牺牲了40%的隐私,实现了60%的个人的便利性,有了隐私计算保护之后,我们可能就只需要牺牲20%的隐私就能实现80%的个人的便利性,隐私保护它就是能够来提升更好的社会福祉。
如何在数据隐私保护的前提下把握智能数据与区块链融合?
姚明:
先从信用本身讲起,信用行业是比较特殊的行业,行业的本质其实是在利用数据和人的历史经验,也就是模型和智慧去判断交易主体的风险。在这样一个领域存在第三方的信用评估场景,这个场景里面有个非常重要的原则,就是 最少可用原则 ,如果大家关注信用产业的话,这个词是在政策法规中频繁提到的。最少可用的原则其实是为了保护主体的隐私能够不被泄漏,并且不被侵犯,这在今年的民法典里面也有所体现。另一部分也是为了保障公平性。对于最少可用,实际上来说它实现的对于信息的可见部分尽可能不让它去泄漏出来或者被转售。对于这个最小可用原则,如果我们将它定义为是对可见的信息部分的一个保护,现在技术就提供了一个更新的机会,对于那些不可见的计算价值部分,如果我们能够将它抽取出来,是不是就可以打破这个最少可用的原则呢,这点就对于信用评价,特别是风控有重大的意义。
因为从风控的角度来说,它其实并不希望用最小可用原则,他希望用更多的数据来刻划交易对象的风险,以此来进行信用的量化定价和控制风险,这两者实际上是冲突的。那么这种冲突就给联邦学习和多方安全计算提供了机会,对于数据,把它用于计算的价值,从它的可见信息部分抽离出来,让这个不可见的计算价值部分尽可能多的去参与共享,参与流通,参与信用评价,这样就可以从技术层面突破最少可用原则,但是又充分保护了可见的个人隐私信息部分并没有被侵犯或者被泄漏,这个实际上是对信用产业一种技术的革新。
如何对整个系统做安全验证?
曾纪策 :
从数据交换或者隐私计算的原理来说,安全验证需要各种算法的证明、一些证书等等。从系统层面来说,比如系统经过安全的认证,3A、4A的安全认证,包括合作方的身份,还有授权,还有账号,还有审计。另外还有一个很大的杀手锏,因为微众银行是完全基于开源的一套东西,我们整个开源产品的家族,包括在线推理、一键可溯化的建模即将推出,也会跟区块链技术结合。我们不单单想在学术界去建立一些标准,我们也尝试通过开源的手段,在工业界建立一些标准。前面几点只是说我们在前面做了一些手段,事后我们还继续提供可审计,包括我们会提供一些网络抓包的方式,还有日志,我们会利用区块链对整个合作过程中的一些行为追溯。
如何突破传统的数据合作模式,实现新型数据可用不可见的联合建模和价值共享?
武姗姗:
在传统的数据合作模式下,数据的使用权和所有权难以分离,大家都认可我们每方数据放在一起进行计算、建模、应用、分析,会产生更好的结果。但通常在实践中你会发现,那些拥有比较珍贵的数据资源的企业是非常不愿意去分享他的数据的,一是收到数据的一方不会再对同样的数据进行反复付费,另外脱离了数据所有权人的控制之后,它的用途实际上是很难以再被明确和被监管的,这是问题之一。问题之二,回到联合建模,原来联合建模过程中,大家都是输出一些脱敏后的数据标签,它包含某种信息,但是颗粒度更粗,所以它离真实建模的场景远一些。回到联邦学习,联邦学习实际上提出了一种比较新的技术架构,大家可以在物理分散但是逻辑集中的情况下进行联合的计算,整个流转过程是可用不可见的。
隐私计算在整个商业化落地过程中所遇到的挑战
林琳:
第一个挑战是安全性证明,安全性是客户最关心的,而且是最难证明的一个环节和步骤,安全性证明会分成两个部分,一个是理论安全性,另外一个是工程安全性。理论安全性是通过完成一些行业相关的认证,另外还会跟客户一起去做安全相关的POC,来解决这个问题。工程安全性,我们希望通过我们产品把多方安全计算以及联邦学习这样一个非常复杂的但又很黑核的技术,能够把它透明化,让用户可以看到每一个运行的实际的步骤,每一个节点的流转,让他们觉得这个技术相对是可控的。第二个挑战,隐私计算也是一个非常新的技术,各个方面都没有像其他的产品那么成熟,所以它的应用门槛是非常高的,我们希望通过现在已经在做的或者已经上线的,包括流程的自动化,联邦学习的可拖拽建模,以及联邦共享的一些算法库以及模型库来解决这样的问题,不断降低用户的使用门槛,推动大规模应用。
第三个挑战,这个行业有非常多的技术流派,并且到目前为止,这些技术流派之间还不能够做到互相兼容,我们也是希望在这个环节里面,可以不断地去推动互联互通,然后去推动行业往前再走一步。
联邦学习和隐私计算适合在哪些领域大放异彩?
林琳:
目前我们的多方安全计算以及联邦学习技术已经在智能风控、智能运营、政务开放和智能营销等领域都有一些非常好的案例。我们最近和交通银行以及中国移动合作的基于多方安全计算的中小企业融资服务项目,最近被选入了中国人民银行上海总部的金融科技创新监管试点应用。在这个项目里面,我们是通过多方安全计算这个技术,在数据不出域的情况下,让银行方和运营商这双方的企业的关系图谱,他们可以融合起来,帮助金融机构去识别这个企业背后非常复杂的关系网络和欺诈风险,帮助金融机构更精准地去投放中小企业的贷款,提高他们的风控水平,同时也提高用户的贷款体验。这个项目是 目前第一个进入央行监管沙箱的隐私计算项目 ,我们认为它可能会对隐私计算整个行业在金融行业之后的发展和应用,会有很好的指引的作用。武姗姗:
我们觉得隐私计算是通用型的技术,在各个行业都可以大有作为,我们说到传统的农业吧,在农业这块的银企合作,我们现在正在跟一家做农业批发市场数字化工具的企业在合作。曾纪策:
联邦学习在国内用得比较多的场景就是风控之类的场景,有小微的信贷,贷前、贷后的审批。微众自己的几个拳头贷款的产品也用到了目前我们纵向联邦的技术。同时在横向联邦里面,微众有一个项目叫反洗钱,这个项目 被深圳市作为重点推荐的试点 。除此之外,还做了一个千人千面的东西,有点类似于保险或者权益。姚明:
总结来看,隐私计算技术是诞生在一个很特殊的环境之下的,它诞生的前提是多方参与整个数据的流转,这里面可能涉及到的一个场景或者场景方的角色包括数据的提供方,数据的应用方,对于数据进行加工的技术服务方,还包括政府的监管机构,他需要来判定整个服务体系或者平台类的安全合规性的问题,另外可能还存在一些观察者或者想了解这个东西本身的。我们基因是服务于信用产业的,当然我们外延就是服务于整个金融产业,再外延就是服务政务金融。徐敏:
我个人看好三个行业:金融、大健康,包括社会服务,包括智能,因为这三个行业一方面是量身定制方案的,第二是它是非常个人化的场景。我讲一下场景应用后的效果,很多时候两个数据碰撞的效果非常非常出乎人意料,我们最近在做的项目,帮一个银行做预售性风控模型,我们通过引用运营商七到八个因子,和银行因子碰到一起,效率非常高,因为两个行业之前是不同的行业,运营商并不知道自己的数据在金融行业这么有用,而银行不知道运营商有多少数据,我们作为桥梁,是把整个数据进行更加高效的合作,一定带来更多的回报,对整个社会会更好。
隐私计算和联邦学习的发展趋势
徐敏:
2020年是隐私计算元年,2021年是隐私计算的应用落地年 ,我能想见在接下去一年中,会出现很多很多百花齐放的场景,很多场景会得到全行业的复制。蓝象智联会重点聚焦在金融行业,同时我们会重点聚焦在金融的营销和风控两个领域。姚明:
整个市场关于数据流通的环节可以分为四个时代, 第一个时代就是数据搬家的时代 ,这个是在四五年前的时候,之前一直是这样的模式,之后出现了 API的时代 , 即用即调这样的模式,再之后出现了沙盒的模式 。2020年的时候,隐私计算,通过数据可用不可见,数据不离库的方式,它是沙盒模式的升级版,如果看待真实的市场是这四种模式共存,在我看来,整个隐私计算的应用不但要开发自己新的落地的场景,还要升级迭代传统的已有的数据流通或者是共享交换的商业模式。所以从整个市场来看,既有存量市场,又有增量市场,从技术侧来看,不管是数据搬家,还是API的调用,还是沙盒还是隐私计算都有各自价值发挥的空间,我并 不认为某一种技术能通吃整个市场 ,更多的还是根据场景的特点选择组合或者是叠加某项技术来完成这个商业落地。曾纪策:用一句俗一点的话说,不管白猫黑猫能抓耗子的就是好猫,没有万能的技术,只有万能的组合,这是我的观点。
我认为在技术上一定也是百花齐放,不同的隐私技术方面的成熟还就框架方面的层出不穷,框架也会趋向开放性跟成熟性。武姗姗:第二,微众目前在构建商业化的时候运营了一个比较大的合作的网络,有很多问题就暴露出来,我觉得标准依然是非常重要,特别是在工业应用的标准,如果我们在系统框架有一套应用场景,互联互通就会变得更为简单。
第三,因为这个网络趋向越大越丰富,治理的问题也比较突出,包括每一个用数方、供数方他的贡献度是怎么去治理的,他的安全性等等这些治理也是会变得非常重要。
第四,监管,在今年我国也发布了类似的法律法规,这个领域就大放异彩。
我们觉得2021年,一个是随着隐私业务的持续的爆发,随着市场不断的反馈和表达,也随着刚才说到的隐私信息的共享和交换相关的法律法规逐步的实施和构建,当然再加上在座的各位领导和同仁,我们的行业共同的深耕,我们认为2021年一定是在这些推动下,隐私计算会有一个长足的演进。那么在这个演进的过程中,可能大家会找到更适合自己的路线,可能有一些合作伙伴会往平台化演进,沿着场景化深耕。对于我们来说,我们会做更多的互联互通的工作,跟大家一起去把技术更成熟,它的应用场景再往前推一步。林琳:
第一点,2021年,整个市场对于隐私计算的接受度会有个非常好的上升,也会有大量的商业化的案例去落地。第二点,我们非常认同技术精进这一点,我们背后有竞争,但有很多的交流,会在很小的技术细节上去共同努力攻克它,真正把这个技术再往上推一个高度。
第三点,我们认为2021年在监管层面,我们行业的标准会更加明确,我们整个隐私计算的赛道它的商业逻辑也会更加清晰。
第四点,我非常认同互联互通这个说法,因为从终极的思维来想,隐私计算将来非常有可能成为一个非常重要的一个底层的基础设施。我们希望能够把隐私计算串联起来,真正能够让数据、价值和AI的价值,以安全的方式在更多的地方流动起来。