1、隱私計算技術將成數據價值安全釋放的關鍵突破口
數據要素市場改革正在加速。
2015年開始,大數據上升為國家發展戰略,全國各地相繼成立大數據交易所,各個大數據交易平台網站也陸續上線,但由於缺乏相關的行業規範和安全保障,這些數據交易平台並沒有發揮最大效用。
2020年出台的《關於構建更加完善的要素市場化配置體制機制的意見》,為推進數據要素市場化改革指明了方向。
此後,深圳、北京、廣東等地相繼發文,規劃設立交易場所進行大數據交易。
數據要素市場改革推動了數據產業的商業模式創新。
據《數據交易的商業模式》研究報告,數據交易商業模式的框架主要由“3+4+1”要素構成。其中:
3表示“數據交易的環境”、“數據交易的基礎設施”、“法律環境和市場機制”,
4表示“主體”、“客體”、“流程”和“標準”,
1表示“數據交易的商業實踐”。
經過多年探索和實踐,當前市場存在直接交易模式、授權轉移模式、數據市場模式、一般數據平台模式、具備授權和問責制數據平台模式、數據銀行模式和數據信託模式7種數據交易商業模式。
數據產業商業模式創新對數據安全提出新需求。
要進行數據交易要著力破解制約要素市場化的主要矛盾,如:數據開放共享、安全保護、數據確權、隱私安全等瓶頸制約,隱私計算技術是解決數據開放安全問題的重要突破口。
隱私計算能夠在處理和分析計算數據的過程中能保持數據不透明、不洩露、無法被計算方以及其他非授權方獲取。
在隱私計算框架下,參與方的數據不出本地,在保護數據安全的同時實現多源數據跨域合作,可以破解數據保護與融合應用難題。
2020年11月,Gartner發布了企業機構在2021年需要深挖的重要戰略科技趨勢,其中就包括隱私增強計算。
並提出:隨著全球數據保護法規的成熟,各地區首席信息官所面臨的隱私和違規風險超過了以往任何時候。
不同於常見的靜態數據安全控制,隱私增強計算可在確保保密性或隱私的同時,保護正在使用的數據。
2021年7月,Gartner發布隱私計算的技術成熟度曲線-2021版本。
Gartner指出:在2023年底之前,全球80%以上的公司將面臨至少一項以隱私為重點的數據保護法規。
到2024年,隱私驅動的數據保護和合規技術支出將在全球突破150億美元以上,即達到千億人民幣以上。
到2025年,60%的大型組織將在分析、商業智能或云計算中使用一種或多種隱私增強的計算技術。
2、隱私計算三大技術路徑:聯邦學習、安全多方計算、可信計算
常見的實現隱私計算的技術路徑包括聯邦學習、安全多方計算、可信計算等,此外區塊鏈也是隱私計算的重要補充。
聯邦學習
聯邦學習是一種分佈式機器學習技術和系統,包括兩個或多個參與方,這些參與方通過安全的算法協議進行聯合機器學習,可以在各方數據不出本地的情況下聯合多方數據源建模和提供模型推理與預測服務。
在聯邦學習框架下,各參與方只交換密文形式的中間計算結果或轉化結果,不交換數據,保證各方數據不露出。
聯邦學習可以通過同態加密、差分隱私、秘密分享等提高數據協作過程中的安全性。
聯邦學習首先由谷歌公司於2016年提出,2018年由微眾銀行引入國內,恰好遇到隱私保護、信息安全監管趨嚴,該技術很快就得到各大互聯網公司、科技巨頭、人工智能公司重視。
安全多方計算
安全多方計算是一種在參與方不共享各自數據且沒有可信第三方的情況下安全地計算約定函數的技術和系統。
通過安全的算法和協議,參與方將明文形式的數據加密後或轉化後再提供給其他方,任一參與方都無法接觸到其他方的明文形式的數據,從而保證各方數據的安全。
安全多方計算的基本安全算子包括同態加密、秘密分享、混淆電路、不經意傳輸、零知識證明、同態承諾等。解決特定應用問題的安全多方計算協議包括隱私集合求交、隱私信息檢索及隱私統計分析等。
由於安全多方計算需要消耗大量的計算和通信資源,目前應用更加適用於小規模數據量,並且應用主要是聚焦相對簡單的統計、查詢等類型的計算,而基於安全多方計算的聯合建模框架只能支持相對簡單的機器學習模型,如邏輯回歸模型等。
可信計算
可信計算指借助硬件CPU芯片實現可信執行環境(TEE),從而構建一個受保護的“飛地”(Enclave),對於應用程序來說,它的Enclave是一個安全的內容容器,用於存放應用程序的敏感數據與代碼,並保證它們的機密性與完整性。
可信計算(TEE)是基於硬件和密碼學原理的隱私計算方案,相比於純軟件解決方案,具有較高的通用性、易用性和較優的性能。其缺點是需要引入可信方,即信任芯片廠商。
此外由於CPU相關實現屬於TCB,側信道攻擊也成為不可忽視的攻擊向量,需要關注相關漏洞和研究進展。
由於技術路徑的不同,各類隱私計算技術均有其更加適用的場景:
多方安全計算技術不依賴硬件且具備較高的安全性,但是僅支持一些相對簡單的運算邏輯;可信執行環境技術具備更好的性能和算法適用性,但是對硬件有一定依賴;聯邦學習技術則可以解決複雜的算法建模問題,但是性能存在一定瓶頸。
3、隱私計算在金融、政務、醫療等行業有望獲得快速應用發展
自2018年開始,隱私計算的技術和產品成熟度迅速提升,在我國加快培育發展數據要素市場、數據安全流通需求快速迸發的推動下,隱私計算技術的應用場景越來越多。
在金融領域,隱私保護計算為金融機構間甚至跨行業的數據合作、共享提供可能。
PSI技術可以解決數據對齊時造成客戶名單洩露的問題,聯邦學習可以保證各方數據不出本地的情況下實現聯合建模、預測等。
國內隱私計算在金融場景應用方面,以營銷、風控端(反欺詐、反洗錢等)等為主要落地場景。
在政務領域,通過隱私保護計算和其他技術的結合,可以有效保護各政府部門的數據,在一定程度上解決政務數據孤島問題,提高政府治理能力。
在醫療領域,醫療機構想要使用人工智能對某一疾病進行早期發現或臨床診斷,一方面需要收集不同維度的數據包括臨床數據、基因數據、化驗數據等,另一方面也需要收集來自不同群體、不同地區的樣本數據,單個醫療機構無法積累足夠的數據來進行模型訓練。
通過隱私保護計算,可以對不同的數據源進行橫向和縱向的聯合建模,保證各方醫療數據安全。
另外,對於DNA測試,用戶可以通過PSI等技術將某段DNA序列和數據庫進行匹配,實現遺傳疾病診斷。
4、螞蟻、騰訊紛紛入局,初創企業不斷湧現
目前,螞蟻金服、騰訊雲、百度、京東等互聯網企業推出了各自的產品,同時以微眾銀行、安恆信息等行業性公司也開始佈局,此外,華控清交、富數科技、矩陣元、數牘科技、锘崴科技、光之樹科技、零知識科技等一批專注於隱私計算產品化的初創企業也不斷湧現。
(1)螞蟻金服
螞蟻鏈摩斯多方安全計算平台:大規模多方安全計算商用平台,基於多方安全計算、隱私保護、區塊鍊等技術,實現數據可用不可見,解決企業數據協同計算過程中的數據安全和隱私保護問題,助力機構安全高效地完成聯合風控、聯合營銷、聯合科研等跨機構數據合作任務,驅動業務增長。
螞蟻鏈摩斯多方安全計算平台獲得70多項相關專利(全國第一),性能超業內算法3~100倍,iDASH2019隱私計算比賽全球冠軍,率先在金融、電信、汽車等10多個行業中完成商用,支持上百家企業線上系統運行,能夠支撐實際生產環境下的複雜數據安全計算任務。
螞蟻鏈摩斯多方安全計算平台是全球首個可信聯合計算商業聯盟創始成員,致力於技術、產品、生態等資源和能力共享。
(2)騰訊雲
騰訊雲安全隱私計算(CSPC)是騰訊雲推出的以聯邦學習(FL)、安全多方計算(MPC)、可信執行環境(TEE)等隱私數據保護技術為基礎的隱私計算平台,產品針對機器學習算法進行定制化的隱私保護改造,保證原始數據不出本地即可完成聯合建模,同時支持安全多方PSI(隱私保護集合求交技術)、安全隱私查詢、安全統計分析,提供基於硬件的TEE可信執行環境。
通過騰訊雲安全隱私計算,各合作機構既能保障數據安全,又能發揮數據最大價值,很好地解決了業界數據孤島的難題。
(3)微眾銀行
聯邦學習方面,早在2019年2月,微眾銀行便將自主研發的全球首個工業級聯邦學習框架FATE予以正式發布,提供基於數據隱私保護的分佈式安全計算框架,為機器學習、深度學習、遷移學習算法提供高性能的安全計算支持。
目前,FATE已在信貸風控、客戶權益定價、智慧零售、智慧醫療、監管科技等領域推動應用落地。
安全多方計算方面,微眾銀行給出了場景式隱私保護解決方案WeDPR。
該方案組合多種隱私保護策略,融合安全多方計算、同態加密、零知識證明、選擇性披露等算法,滿足多變業務流程,並圍繞開放數據平台、敏感黑名單互通、聯合風控、匿名投票、安全支付、隱秘競拍等典型場景,陸續開源其中的核心算法實現。
區塊鏈方面,微眾銀行在多年技術沉澱的基礎上,發布的區塊鏈核心項目已超過10個,構建了涵括底層、中間件和應用組件在內的全棧技術體系。其中,由微眾銀行牽頭研發的國產安全可控區塊鏈底層平台FISCO BCOS,成為國家信息中心頂層設計的區塊鏈服務網絡BSN中首個國產聯盟鏈底層框架。
且自2017年向全球開源以來,已匯聚了2千多家企業機構、逾4 萬名社區成員,建成最大最活躍國產開源聯盟鏈生態圈。開源社區內數百個應用基於FISCO BCOS研發,其中已有超過120個應用投入使用,覆蓋政務、跨境數據流通、金融、公益、醫療、教育等多個領域。
(4)安恆信息
AiLand數據安全島平台是一個專注於保障數據安全流通,致力於解決數據共享過程中的安全、信任和隱私保護問題的隱私計算平台。
綜合應用安全計算沙箱,聯邦學習,MPC等多種前沿技術,配合關鍵行為數字驗籤和區塊鏈審計技術,實現共享數據的所有權和使用權分離,確保原始數據的“可用不可見”、 “可用不可取”,保障多方數據聯合計算過程的可靠、可控和可溯。
(5)翼方健數
翼方健數成立於2016年,被業界稱為國內“隱私計算四小龍”,其核心團隊成員來自軟銀願景基金合夥人、阿里巴巴美國數據科學研究院、阿里巴巴軟件平台架構部門、百度人工智能板塊以及醫療、醫藥、保險等多行業的管理者和資深技術人才。 2021年7月底,公司宣布完成3億元B+輪融資。
公司自主研發的隱私計算平台——XDP翼數坊基於核心隱私安全計算技術為政務、醫療、醫藥、生信、金融、保險和營銷等行業賦能,業務板塊覆蓋中國超30個城市。
公司相關解決方案應用在了高校、機構和企業中,如中國科學院、健康醫療大數據國家研究院、香港科技園、國內著名三甲醫院、金融機構、世界500強快消品企業等。
5、隱私計算未來有望形成多樣化的商業模式
隱私計算往往涉及到3類角色:
首先是使用數據的業務方,包括金融機構、政府機構,這類機構是隱私計算服務的客戶;
其次是作為數據源的數據方,包括大數據局、徵信公司、擁有用戶數據的互聯網公司等;隱私計算技術服務商,則為客戶搭建整個計算系統。
通常情況下,三種角色是分離,而在有些場景下,一個機構可能兼兩種角色。
據KPMG《隱私計算行業研究報告》,基於目前的主流部署和合作模式,技術服務商對業務方有4種基本營收方式:
(1)銷售模式,即收取一次性技術系統搭建費,這是最經典的軟件系統銷售模式,費用按照系統所消耗的計算存儲資源、佈置節點數目測量,每單從數十萬到數百萬不等,差異較大。
(2)服務模式,即收取年度系統維護和服務費用,這不僅是因為一般軟件系統都有日常維護需求,還因為隱私計算的算法本身和應用場景中的模型更新較快,可能需要重新調整算法和模型。
(3)調用模式,即收取數據使用費,這部分費用主要歸屬於數據方,技術服務商只是作為收費通道代數據方向客戶收取,也有時候會賺取數據使用的差價或撮合費用。收費標準根據數據種類和價值而定,按照數據調用次數收取,單次調用費從幾分到幾角不等。有時候,數據價值無法在使用前確定,需要經過一段時間試用,客戶才能根據實際效果確定付費標準。
(4)分潤模式,即根據業務運行效果,獲取收益分成。在這種模式下,客戶早期往往並不需要承擔大筆技術系統搭建費,相當於技術服務商與客戶聯合運營業務。
基於系統接入數據源,原有業務改善或新業務開展之後,雙方根據業務實際效果分潤。
目前來看,隱私計算的商業模式尚處於探索過程中,我們預計在發展早期主要以系統銷售模式和服務模式為主,未來調用模式和分潤模式將打開更大的市場空間。
KPMG預測,隱私計算國內市場規模將快速發展,三年後技術服務營收有望觸達100-200億人民幣的空間,甚至撬動千億級的數據平台運營收入空間。
6、報告總結
伴隨著數據要素市場改革加速,隱私計算技術成為數據價值安全釋放的關鍵突破口,有望在金融、政務、醫療等行業實現快速應用,其千億藍海市場有望開啟。
行業公司:在隱私計算/數據安全領域有前瞻佈局的公司安恆信息、奇安信、深信服、綠盟科技、美亞柏科、啟明星辰,其他包括衛士通等。
7、風險提示
市場競爭加劇風險;技術變革風險;人員流失風險。
文章來源:財經遠瞻
文章原標題:《隱私計算:你不了解的千億藍海市場,初創企業正在不斷湧現》
文章來源於網絡,如有侵權請與我們聯繫刪除。