链新(ID:ChinaBlockchainNews)原创作者 | 冯铭

在当下区块链行业的前沿发展探索中,“隐私计算”的身影也开始逐步显现。

目前,无论是BAT等大厂,或是初创型科技企业,都在纷纷入局隐私计算。蚂蚁金服、腾讯云、百度推出了各自的产品,华控清交、富数科技等一批专注于隐私计算产品化的初创企业也不断涌现。

究竟什么是“隐私计算”?它能在区块链及未来的数字经济中扮演怎样的角色?隐私计算有待解决或即将面临的挑战又是什么?

隐私计算火了

对个人或企业来说,隐私是一个敏感的话题。近年来,例如“大数据杀熟”、“感觉手机在监听消费喜好”、“被困在算法里的外卖小哥”等话题的讨论,反映了人们对保护数据安全和个人隐私的需求日益走高。

那么,什么是隐私?隐私计算如何达到隐私保护的目的?

隐私计算(Privacy Computing)是一种由两个或多个参与方联合计算的技术和系统,参与方在不泄露各自数据的前提下,通过协作对他们的数据进行联合机器学习和联合分析。

隐私计算的参与方既可以是同一机构的不同部门,也可以是不同的机构。

隐私计算主要目的是使数据在各个环节中“可用不可见”,相比于传统数据保密方法,其最革新的亮点是能够实现数据的物理分散、逻辑集中,在确保数据安全隐私性的同时,还能挖掘数据价值、促进价值流通。

作为一种跨学科的综合技术,隐私计算涉及相关概念较多:多方安全计算、可信硬件、联邦学习、差分隐私、区块链等。

目前业内主流技术路线包括三类:联邦学习(FL)、安全多方计算(SMPC)和机密计算(CC)/可信执行环境(TEE)。

全球权威技术研究和分析公司Gartner发布的2021年需要深挖的9项重要战略科技趋势中,隐私计算也进入了榜单。

区块链和隐私计算需要结合

业内人士普遍认为,区块链和隐私计算需要相互结合、相互赋能才能发挥效力。区块链解决的是去中心化和信任的问题,隐私计算则是保证个人以及商业机构的隐私在链上不被泄露,两者结合起来,是建设未来去中心化社会的必经之路。

《腾讯隐私计算白皮书》特别提到,隐私计算虽然实现了在多方协作计算过程中对于输入数据的隐私保护,但是原始数据、计算过程和结果均面临着可验证性问题。

而区块链因其共享账本、智能合约、共识机制等技术特性,可以实现原始数据的链上存证核验、计算过程关键数据和环节的上链存证回溯,确保计算过程的可验证性。

因此,将区块链技术对计算的可信证明应用到隐私计算中,可以在保护数据隐私的同时增强隐私计算过程的可验证性。

反观区块链行业,众所周知,区块链最大的强项是没有中心化的管理和所有权。如何让用户相信并参与管理他们自己的数据呢?用户可以受到合理地激励吗?

“需要在区块链之外附加强大的数据安全体系,建立安全闭环,数据流全程都处于数据安全体系的保护之中,没有任何的安全缝隙,确保在用户之外没有人(包括项目方在内)能够窥视用户数据。”国际密码学应用科学家、YottaChain分布式存储公链创始人王东临向《链新》表示。

王东临强调,区块链本身并不保证数据的隐私性,区块链用了密码学的Hash和签名,但没有包含加密,数据的隐私是需要在区块链之外附加特定的数据安全体系来实现的。激励体系则是区块链的主要价值之一,但激励是否合理取决于项目具体怎么设计,以及怎么运营。

王东临称:“可以这么说,合理的激励是可行的,但大部分的项目都做不到。”

因此在区块链行业,隐私计算也被认为是通往Web 3.0的必由路径。Web 3.0的关键属性是数据的所有权归属用户自己。隐私计算是极少数能提供多方数据联合计算的技术,它能够让数据在一个安全的环境内执行、并且被保护起来。

落地进行时

隐私计算在经历了2019年的技术普及和市场教育阶段,2020年的大规模概念验证和试点部署阶段之后,于2021年开始进入真正尝试规模化应用的阶段。

以医疗领域为例,患者数据较为敏感,并且基于医疗数据的各项科学研究通常需要大量样本,单一数据源的数据量很难满足海量的数据需求,而数据共享过程中又会带来隐私泄露的风险。应用隐私计算技术进行多方协同过程中,能够有效的防止关联敏感信息的医疗数据被泄露,保证数据安全。

目前,已有多家医疗机构通过横向联邦学习的解决方案,在各医疗机构数据不出域的前提下,联合构建了一个目标检测模型,使得有效训练数据显著增加。据悉,多方联邦训练的模型的性能,比单个医疗机构训练的模型的性能提升30%以上。

在金融行业,富数科技合伙人、高级总监黄奉孝曾对媒体表示,隐私计算技术有可能会成为私域流量平台之间的边界,它有可能会重新构造流量业务的内部逻辑和商业模式。

举个简单的例子,银行存款用户数量庞大,但是单纯依赖行内的客户数据,很难圈出对购买理财感兴趣的用户。一般的操作都是通过API或者离线库的方式采购第三方数据公司的标签,API查询动作很大程度上会对银行客户ID隐私造成威胁。而隐私计算,可以从技术上保证这类业务的隐私数据安全性。

通过对案例的分析可以发现,当前隐私计算技术主要应用在金融、互联网、政务、通信、医疗等领域,主要的应用场景有精准营销、金融风控、医疗健康、身份验证等等。

“隐私计算结合到区块链技术领域大约有几年的时间了,但过去由于应用场景不凸显,痛点不清晰,所以在实际商业场景的落地中,一直找不到最佳的价值发挥。”德鼎创新合伙人王岳华坦言,隐私与安全是区块链协议里最基本的存在,但是由于过去分布式数据的实际落地场景并不凸显,隐私计算也就乏人问津。“数据的价值是无限的,但唯有在数据的隐私与安全获得相应的保障下,其价值才能体现并发挥。”

是挑战,也是机遇

毋庸置疑,隐私计算本身有非常大的价值和应用前景,但是想要达到百亿级的市场规模,突破商业化的发展瓶颈,还有非常长的路要走。

一方面,目前市场对于隐私计算的认知度、认可度仍然不足。由于隐私计算技术复杂且常常呈现“黑盒化”现象,大部分用户对隐私技术难以理解和信任。如果对技术理解得不够全面,会导致用户会对技术应用的效果产生过度预期。

以“区块链+数字身份”行业应用为例,“目前落地效果一般”,一位区块链行业资深产品经理对《链新》表示,主要的发展瓶颈就在于:一是区块链技术和数据隐私保护技术存在性能偏低的问题;二是用户隐私保护和企业数据变现的商业模式存在冲突,在安全多方计算很不成熟的前提下,目前要保护用户隐私只能授权身份验证,无法授权身份信息,可能导致企业没有参与的动力;三是DID和私钥都很难记忆,且需要用户自己保存,对用户的使用门槛较高。

另一方面,技术推广所需的成熟商业模式仍在形成。当前市场正处于快速发展的早期阶段,明确的激励机制、利益分配机制、通用的平台收费机制等商业化落地模式尚未形成,难以支撑技术的大规模推广。

以“区块链+不动产登记”行业应用为例,目前主要针对信息登记,实现信息层面的互通,并未实现资产和价值的流转。

“其社会效益和示范价值巨大,但是从目前的商业模式看,盈利性相对有限。”中国通信工业协会区块链专委会轮值主席于佳宁向《链新》分析,其中一个制约因素就是信息共享和隐私保护存在一定程度上的矛盾。

“不动产登记涉及到了多方参与,在多方参与的过程中需要进行区块链多方账本的信息共享,但共享后如何保护每个参与方的数据隐私?如何用好隐私计算等技术,在信息共享的前提下保护隐私安全,实现数据可用不可见,也是未来我们亟待解决的问题。”于佳宁向《链新》表示。

此外,相关法律、标准、规则缺失,数据审计、保险等配套产业仍不完备,也是制约隐私计算发展的重要原因。

值得注意的是,目前隐私计算尚无真正意义上的杀手级应用,远未到分出胜负的时候,因而发展潜力巨大。随着当前大数据产业的迅速发展,效率、性能、成本等综合能力将是各类主体在隐私计算产业竞争的重要抓手。