1、隐私计算技术将成数据价值安全释放的关键突破口
数据要素市场改革正在加速。
2015年开始,大数据上升为国家发展战略,全国各地相继成立大数据交易所,各个大数据交易平台网站也陆续上线,但由于缺乏相关的行业规范和安全保障,这些数据交易平台并没有发挥最大效用。
2020年出台的《关于构建更加完善的要素市场化配置体制机制的意见》,为推进数据要素市场化改革指明了方向。
此后,深圳、北京、广东等地相继发文,规划设立交易场所进行大数据交易。
数据要素市场改革推动了数据产业的商业模式创新。
据《数据交易的商业模式》研究报告,数据交易商业模式的框架主要由“3+4+1”要素构成。其中:
3表示“数据交易的环境”、“数据交易的基础设施”、“法律环境和市场机制”,
4表示“主体”、“客体”、“流程”和“标准”,
1表示“数据交易的商业实践”。
经过多年探索和实践,当前市场存在直接交易模式、授权转移模式、数据市场模式、一般数据平台模式、具备授权和问责制数据平台模式、数据银行模式和数据信托模式7种数据交易商业模式。
数据产业商业模式创新对数据安全提出新需求。
要进行数据交易要着力破解制约要素市场化的主要矛盾,如:数据开放共享、安全保护、数据确权、隐私安全等瓶颈制约,隐私计算技术是解决数据开放安全问题的重要突破口。
隐私计算能够在处理和分析计算数据的过程中能保持数据不透明、不泄露、无法被计算方以及其他非授权方获取。
在隐私计算框架下,参与方的数据不出本地,在保护数据安全的同时实现多源数据跨域合作,可以破解数据保护与融合应用难题。
2020年11月,Gartner发布了企业机构在2021年需要深挖的重要战略科技趋势,其中就包括隐私增强计算。
并提出:随着全球数据保护法规的成熟,各地区首席信息官所面临的隐私和违规风险超过了以往任何时候。
不同于常见的静态数据安全控制,隐私增强计算可在确保保密性或隐私的同时,保护正在使用的数据。
2021年7月,Gartner发布隐私计算的技术成熟度曲线-2021版本。
Gartner指出:在2023年底之前,全球80%以上的公司将面临至少一项以隐私为重点的数据保护法规。
到2024年,隐私驱动的数据保护和合规技术支出将在全球突破150亿美元以上,即达到千亿人民币以上。
到2025年,60%的大型组织将在分析、商业智能或云计算中使用一种或多种隐私增强的计算技术。
2、隐私计算三大技术路径:联邦学习、安全多方计算、可信计算
常见的实现隐私计算的技术路径包括联邦学习、安全多方计算、可信计算等,此外区块链也是隐私计算的重要补充。
联邦学习
联邦学习是一种分布式机器学习技术和系统,包括两个或多个参与方,这些参与方通过安全的算法协议进行联合机器学习,可以在各方数据不出本地的情况下联合多方数据源建模和提供模型推理与预测服务。
在联邦学习框架下,各参与方只交换密文形式的中间计算结果或转化结果,不交换数据,保证各方数据不露出。
联邦学习可以通过同态加密、差分隐私、秘密分享等提高数据协作过程中的安全性。
联邦学习首先由谷歌公司于2016年提出,2018年由微众银行引入国内,恰好遇到隐私保护、信息安全监管趋严,该技术很快就得到各大互联网公司、科技巨头、人工智能公司重视。
安全多方计算
安全多方计算是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。
通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。
安全多方计算的基本安全算子包括同态加密、秘密分享、混淆电路、不经意传输、零知识证明、同态承诺等。解决特定应用问题的安全多方计算协议包括隐私集合求交、隐私信息检索及隐私统计分析等。
由于安全多方计算需要消耗大量的计算和通信资源,目前应用更加适用于小规模数据量,并且应用主要是聚焦相对简单的统计、查询等类型的计算,而基于安全多方计算的联合建模框架只能支持相对简单的机器学习模型,如逻辑回归模型等。
可信计算
可信计算指借助硬件CPU芯片实现可信执行环境(TEE),从而构建一个受保护的“飞地”(Enclave),对于应用程序来说,它的Enclave是一个安全的内容容器,用于存放应用程序的敏感数据与代码,并保证它们的机密性与完整性。
可信计算(TEE)是基于硬件和密码学原理的隐私计算方案,相比于纯软件解决方案,具有较高的通用性、易用性和较优的性能。其缺点是需要引入可信方,即信任芯片厂商。
此外由于CPU相关实现属于TCB,侧信道攻击也成为不可忽视的攻击向量,需要关注相关漏洞和研究进展。
由于技术路径的不同,各类隐私计算技术均有其更加适用的场景:
多方安全计算技术不依赖硬件且具备较高的安全性,但是仅支持一些相对简单的运算逻辑;可信执行环境技术具备更好的性能和算法适用性,但是对硬件有一定依赖;联邦学习技术则可以解决复杂的算法建模问题,但是性能存在一定瓶颈。
3、隐私计算在金融、政务、医疗等行业有望获得快速应用发展
自2018年开始,隐私计算的技术和产品成熟度迅速提升,在我国加快培育发展数据要素市场、数据安全流通需求快速迸发的推动下,隐私计算技术的应用场景越来越多。
在金融领域,隐私保护计算为金融机构间甚至跨行业的数据合作、共享提供可能。
PSI技术可以解决数据对齐时造成客户名单泄露的问题,联邦学习可以保证各方数据不出本地的情况下实现联合建模、预测等。
国内隐私计算在金融场景应用方面,以营销、风控端(反欺诈、反洗钱等)等为主要落地场景。
在政务领域,通过隐私保护计算和其他技术的结合,可以有效保护各政府部门的数据,在一定程度上解决政务数据孤岛问题,提高政府治理能力。
在医疗领域,医疗机构想要使用人工智能对某一疾病进行早期发现或临床诊断,一方面需要收集不同维度的数据包括临床数据、基因数据、化验数据等,另一方面也需要收集来自不同群体、不同地区的样本数据,单个医疗机构无法积累足够的数据来进行模型训练。
通过隐私保护计算,可以对不同的数据源进行横向和纵向的联合建模,保证各方医疗数据安全。
另外,对于DNA测试,用户可以通过PSI等技术将某段DNA序列和数据库进行匹配,实现遗传疾病诊断。
4、蚂蚁、腾讯纷纷入局,初创企业不断涌现
目前,蚂蚁金服、腾讯云、百度、京东等互联网企业推出了各自的产品,同时以微众银行、安恒信息等行业性公司也开始布局,此外,华控清交、富数科技、矩阵元、数牍科技、锘崴科技、光之树科技、零知识科技等一批专注于隐私计算产品化的初创企业也不断涌现。
(1)蚂蚁金服
蚂蚁链摩斯多方安全计算平台:大规模多方安全计算商用平台,基于多方安全计算、隐私保护、区块链等技术,实现数据可用不可见,解决企业数据协同计算过程中的数据安全和隐私保护问题,助力机构安全高效地完成联合风控、联合营销、联合科研等跨机构数据合作任务,驱动业务增长。
蚂蚁链摩斯多方安全计算平台获得70多项相关专利(全国第一),性能超业内算法3~100倍,iDASH2019隐私计算比赛全球冠军,率先在金融、电信、汽车等10多个行业中完成商用,支持上百家企业线上系统运行,能够支撑实际生产环境下的复杂数据安全计算任务。
蚂蚁链摩斯多方安全计算平台是全球首个可信联合计算商业联盟创始成员,致力于技术、产品、生态等资源和能力共享。
(2)腾讯云
腾讯云安全隐私计算(CSPC)是腾讯云推出的以联邦学习(FL)、安全多方计算(MPC)、可信执行环境(TEE)等隐私数据保护技术为基础的隐私计算平台,产品针对机器学习算法进行定制化的隐私保护改造,保证原始数据不出本地即可完成联合建模,同时支持安全多方PSI(隐私保护集合求交技术)、安全隐私查询、安全统计分析,提供基于硬件的TEE可信执行环境。
通过腾讯云安全隐私计算,各合作机构既能保障数据安全,又能发挥数据最大价值,很好地解决了业界数据孤岛的难题。
(3)微众银行
联邦学习方面,早在2019年2月,微众银行便将自主研发的全球首个工业级联邦学习框架FATE予以正式发布,提供基于数据隐私保护的分布式安全计算框架,为机器学习、深度学习、迁移学习算法提供高性能的安全计算支持。
目前,FATE已在信贷风控、客户权益定价、智慧零售、智慧医疗、监管科技等领域推动应用落地。
安全多方计算方面,微众银行给出了场景式隐私保护解决方案WeDPR。
该方案组合多种隐私保护策略,融合安全多方计算、同态加密、零知识证明、选择性披露等算法,满足多变业务流程,并围绕开放数据平台、敏感黑名单互通、联合风控、匿名投票、安全支付、隐秘竞拍等典型场景,陆续开源其中的核心算法实现。
区块链方面,微众银行在多年技术沉淀的基础上,发布的区块链核心项目已超过10个,构建了涵括底层、中间件和应用组件在内的全栈技术体系。其中,由微众银行牵头研发的国产安全可控区块链底层平台FISCO BCOS,成为国家信息中心顶层设计的区块链服务网络BSN中首个国产联盟链底层框架。
且自2017年向全球开源以来,已汇聚了2千多家企业机构、逾 4 万名社区成员,建成最大最活跃国产开源联盟链生态圈。开源社区内数百个应用基于FISCO BCOS研发,其中已有超过120个应用投入使用,覆盖政务、跨境数据流通、金融、公益、医疗、教育等多个领域。
(4)安恒信息
AiLand数据安全岛平台是一个专注于保障数据安全流通,致力于解决数据共享过程中的安全、信任和隐私保护问题的隐私计算平台。
综合应用安全计算沙箱,联邦学习,MPC等多种前沿技术,配合关键行为数字验签和区块链审计技术,实现共享数据的所有权和使用权分离,确保原始数据的“可用不可见”、“可用不可取”,保障多方数据联合计算过程的可靠、可控和可溯。
(5)翼方健数
翼方健数成立于2016年,被业界称为国内“隐私计算四小龙”,其核心团队成员来自软银愿景基金合伙人、阿里巴巴美国数据科学研究院、阿里巴巴软件平台架构部门、百度人工智能板块以及医疗、医药、保险等多行业的管理者和资深技术人才。2021年7月底,公司宣布完成3亿元B+轮融资。
公司自主研发的隐私计算平台——XDP翼数坊基于核心隐私安全计算技术为政务、医疗、医药、生信、金融、保险和营销等行业赋能,业务板块覆盖中国超 30个城市。
公司相关解决方案应用在了高校、机构和企业中,如中国科学院、健康医疗大数据国家研究院、香港科技园、国内著名三甲医院、金融机构、世界500强快消品企业等。
5、隐私计算未来有望形成多样化的商业模式
隐私计算往往涉及到3类角色:
首先是使用数据的业务方,包括金融机构、政府机构,这类机构是隐私计算服务的客户;
其次是作为数据源的数据方,包括大数据局、征信公司、拥有用户数据的互联网公司等;隐私计算技术服务商,则为客户搭建整个计算系统。
通常情况下,三种角色是分离,而在有些场景下,一个机构可能兼两种角色。
据KPMG《隐私计算行业研究报告》,基于目前的主流部署和合作模式,技术服务商对业务方有4种基本营收方式:
(1)销售模式,即收取一次性技术系统搭建费,这是最经典的软件系统销售模式,费用按照系统所消耗的计算存储资源、布置节点数目测量,每单从数十万到数百万不等,差异较大。
(2)服务模式,即收取年度系统维护和服务费用,这不仅是因为一般软件系统都有日常维护需求,还因为隐私计算的算法本身和应用场景中的模型更新较快,可能需要重新调整算法和模型。
(3)调用模式,即收取数据使用费,这部分费用主要归属于数据方,技术服务商只是作为收费通道代数据方向客户收取,也有时候会赚取数据使用的差价或撮合费用。收费标准根据数据种类和价值而定,按照数据调用次数收取,单次调用费从几分到几角不等。有时候,数据价值无法在使用前确定,需要经过一段时间试用,客户才能根据实际效果确定付费标准。
(4)分润模式,即根据业务运行效果,获取收益分成。在这种模式下,客户早期往往并不需要承担大笔技术系统搭建费,相当于技术服务商与客户联合运营业务。
基于系统接入数据源,原有业务改善或新业务开展之后,双方根据业务实际效果分润。
目前来看,隐私计算的商业模式尚处于探索过程中,我们预计在发展早期主要以系统销售模式和服务模式为主,未来调用模式和分润模式将打开更大的市场空间。
KPMG预测,隐私计算国内市场规模将快速发展,三年后技术服务营收有望触达100-200亿人民币的空间,甚至撬动千亿级的数据平台运营收入空间。
6、报告总结
伴随着数据要素市场改革加速,隐私计算技术成为数据价值安全释放的关键突破口,有望在金融、政务、医疗等行业实现快速应用,其千亿蓝海市场有望开启。
行业公司:在隐私计算/数据安全领域有前瞻布局的公司安恒信息、奇安信、深信服、绿盟科技、美亚柏科、启明星辰,其他包括卫士通等。
7、风险提示
市场竞争加剧风险;技术变革风险;人员流失风险。
文章来源:财经远瞻
文章原标题:《隐私计算:你不了解的千亿蓝海市场,初创企业正在不断涌现》
文章来源于网络,如有侵权请与我们联系删除。