原文:《 Web3.0驅動下的AIGC與數據要素:開放、安全與隱私》
作者:宋嘉吉任鶴義
摘要
Chatgpt作為最火熱的AI產品,其內容生產力是驚豔的,但站在更高層面看,未來Web3.0世界面臨兩個重要問題:一、數據要素市場的建立,如何解決數據確權和隱私保護?二、AIGC是生產力機器,數據是能源資源,該如何將工業機器和能源資源有效地進行配置? Web3.0為二者提供了高效運轉的經濟規則和治理規則,就像操作系統一樣,為AI生產力、數據要素提供更開放的連接交互和最高效的市場配置。 數據隱私的真諦是確權和授權——即用代碼合約明確數據的所有權,通過代碼合約完成數據使用權的授權和支付交易。在數據領域,AI與區塊鏈的結合,一方面是數據層,兩者可以互相滲透,完全數據確權;另一方面是從應用層面入手,兩者各司其職,AI負責自動化的業務處理和智能化的決策,區塊鏈負責在數據層提供可信的授權。這樣,數據作為重要的資源,AI作為生產力更有的放矢。 We3.0時代將為AI、數據要素提供一套開放的經濟和治理系統。 AI作為強大的生產力機器,產出能力無可厚非,但AI輸出價值的背後需要一套經濟系統和治理系統作為支撐。如果將AI比喻為工業機器,那麼數據將是石油等基礎資源,而光有工業機器和資源是無法運行的,將工業機器和資源整合的市場經濟系統才是價值產出的靈魂;Web3.0就是這樣的經濟和治理系統,為AIGC(生產力工具)、數據要素、資產和治理提供了一套開放的“操作系統”,AIGC將在Web3.0世界如魚得水。 Web3.0將從數據、AI“雲化”和經濟價值挖掘三個維度驅動AI和數據要素發揮更高價值。1)在AI對數據資源的快速“消耗”背景下,如何在AI訓練演化的整個流程週期中對數據完全確權、隱私保護和費用結算?這些離不開Web3.0時代各類數據隱私保護應用的加持。 2)如何將AI強大的生產力機器打造成有組織、有智慧的生態系統,還需要機器智慧之外的使得AI、數據要素這些重要資源實現更有效的“配置”。這就像是把AI的能力“雲化”:一方面是AI生產力的獲取分散化、去中心化,可以將多方的資源連接在一起;另一方面這種“雲化”是將更多分散的AI工具、資源、知識在一個平台/市場上解決付費和經濟生態的問題。 3)DeFi和DAO作為經濟系統和治理系統,是Web3.0時代最具特色的存在。 AI生產力和數據資源需要經濟系統提高配置效率,亦需要治理系統的監管。 AI作為生產力工具,需要一套經濟/金融系統來解放其價值潛力:DeFi提供了一種解決方案。 Web3.0時代,不僅要解決數據要素市場的問題,AI算法本身的經濟規則也應該有更開放的解決方案——利用更開放、更廣泛的智慧和資金支持AI算法的演進。 投資建議:OpenAI的異軍突起、AIGC的快速迭代讓數據安全、倫理、隱私等問題更加突出。在數據要素+AI的趨勢下,如何在安全、高效之間取得平衡將成為熱點。二級市場,我們聚焦: 1)三大運營商,中國電信、中國移動、中國聯通; 2)可視化產業鏈:浩瀚深度、恆為科技、中新賽克; 3)內容審查與IP保護:人民網、新華網、博匯科技; 4)BOSS產業鏈,東方國信、天源迪科、亞信科技。 風險提示:區塊鏈商業模式落地不及預期;監管政策的不確定性。 |
1. 核心觀點
Chatgpt作為最火熱的AI產品,其生產力是驚豔的,但站在更高層面看,未來Web3.0世界面臨兩個重要問題:一是數據要素市場的建立,如何解決數據確權和隱私保護?二是AI是生產力機器,數據是能源資源,該如何將工業機器和能源資源有效地進行配置? Web3.0為二者提供了高效運轉的經濟規則和治理規則,就像操作系統一樣,為AI生產力、數據要素提供更開放的連接交互和最高效的市場配置。
數據要素的核心問題是確權和隱私保護,AI生產力需要全世界各方更廣泛、更開放的連接與交互,這些問題在Web3.0世界得到了很好的解決。本報告從數據、AI“雲化”和AI經濟價值挖掘三個維度看Web3.0如何驅動AI和數據要素的發展,打造更開放的經濟生態。
2. Web3.0時代的數據要素市場、經濟和治理問題
2.1Web3.0治理下的數據要素市場使得AI有的放矢
AI時代,隨著人臉識別等技術的發展,用戶在體驗AI服務的同時,時刻都在擔心數據洩露風險。這給AI的推廣和發展帶來了一定阻礙。數據要素是AI工業機器的重要能源,因此,如何解決數據確權、數據安全和隱私保護成為行業發展必須解決的重要問題。
Web3.0提供了數據市場的治理規則。移動時代以來,尤其是AIGC這種跨時代技術的推動下,數據隱私的保護呼聲愈烈,一方面是人們對數據作為一種潛力巨大的價值資源的認識越來越清晰,另一方面作為最密切的產生者,用戶越來越注意數據隱私的保護。過去的互聯網模式,數據主要存儲在互聯網公司的雲端,用戶很難聲明對數據的所有權;互聯網不斷產生的龐雜數據的確權也是出於模糊的“無主”狀態,但所有數據實際上都是掌控在互聯網公司手中——無論他們如何聲明不會洩露數據,不洩露數據不代表我們享有所有權。越來越多的智能服務背後離不開來自於互聯網公司AI機器人利用個人隱私數據進行機器學習的結果,這個過程中,用戶是被動的,利益上存在受損的嫌疑。 Gartner預測,到2024年用於訓練AI的數據中有60%將是合成數據,而AI合成的數據又該如何確權,也是一個重要的問題,Web3.0時代正是為這種複雜的數據產生方式提供了更開放更廣泛的數據和AI算法來源。
數據隱私的真諦是確權和授權——即用代碼合約明確數據的所有權,通過代碼合約完成數據使用權的授權和支付交易。作為Web3.0時代的代表性技術,區塊鏈天然就是去中心化和分佈式的賬本機制,具有數據加密、不可篡改、來源可溯的特點。大量移動端的數據,將由過去“無主”壟斷狀態,被區塊鍊網絡確權給用戶,而AI所需要的個人數據,可以由用戶向使用方授權完成,甚至費用可以以Token的形式在區塊鏈上完成結算。在數據領域,AI與區塊鏈的結合,一方面是數據層,兩者可以互相滲透,完全數據確權;另一方面是從應用層面入手,兩者各司其職,AI負責自動化的業務處理和智能化的決策,區塊鏈負責在數據層提供可信的授權。這樣,數據作為重要的資源,AI作為生產力更有的放矢。
Web3.0時代,AI和數據要素的演化,將重構互聯網商業生態。過去20年互聯網巨頭們依靠享受大量數據的支配權(實際上用戶一直認為數據是屬於他們)和強大的網絡效應掌控了互聯網的主要資源和價值。在技術的快速發展過程中,互聯網的商業經歷了計算機的開源、軟件的開源和數據的開源,曾經的巨頭壟斷被不斷打破。如今,隨著區塊鏈、AI和5G等信息技術的崛起,整個互聯網加速由巨頭互聯網公司中心走向分佈式和去中心化,價值壟斷正在被打破。進入Web3.0時代,AI和數據要素將重構新的商業生態。
2.2Web3.0作為經濟和治理系統為AI生產力提供運行邏輯
AI作為強大的生產力機器,產出能力自然是驚豔的,但AI輸出價值的背後需要一套經濟系統和治理系統作為支撐。如果將AI比喻為工業機器,那麼數據將是石油等基礎資源,而光有工業機器和資源是無法運行的——工業機器需要運行邏輯,而資源需要流通和調節供給——將工業機器和資源整合的市場經濟系統才是價值產出的靈魂;Web3.0就是這樣的經濟和治理系統,就像組織創新、生產和流通一樣,Web3.0將AI(生產力工具)、數據要素、資產和治理提供了一套開放的“操作系統”,AI將在Web3.0世界如魚得水。
3. 三個維度看Web3.0如何驅動AI和數據要素
3.1 數據的有效獲取:確權和隱私
數據隱私已成為全球監管的焦點問題,現行的解決方案一是強化法律保護,利用區塊鍊等技術完成數據確權;二是引入隱私計算,通過同態加密、多方安全計算、可信執行環境等技術,保證數據在使用過程中是明文不可見的。在AI對數據資源的快速“消耗”背景下,如何在AI訓練演化的整個流程週期中對數據完全確權、隱私保護和費用結算?這些離不開Web3.0時代各類數據隱私保護應用的加持。
本節以Horizen為例探討Web3.0時代如何在數據流轉、使用過程中保護隱私。 Horizen可以為用戶(包括企業用戶)提供一個不上傳本地隱私數據前提下完成開發的基礎區塊鏈平台,企業可以藉此為用戶提供區塊鏈相關服務,但又充分保護了企業的隱私數據。
Horizen原名Zencash,致力於打造隱私保護和基礎區塊鏈平台,為用戶或企業可以在不上傳本地隱私數據的前提下提供開發平台。 Horizen由主鍊和側鏈構成。 Horizen主鍊主要是為用戶的交互提供簡單且安全的價值傳輸和存儲層,通過原生治理代幣ZEN為整個Horizen的生態運轉提供支持,以及為側鏈提供必要的基礎架構。而具體功能的實現以及網絡基礎結構等均由側鏈開發完成,從而能夠針對特定的用例進行更為複雜的性能優化,增強其可擴展性和安全性。 Horizen側鏈又稱Zendoo,其具有極高的擴展性和設計性。側鏈有獨立的共識機制與加密算法,並且真正的實現了去中心化。開發者可通過Horizen開放的一套標准通用組件ZEN側鏈開發套件(SDK)來迅速完成區塊鏈的開發,從而節省區塊鏈的構建時間。利用側鏈附帶的零知識證明工具可以在不上傳本地隱私數據的前提下,完成企業需求的開發。
同時,主鏈與側鏈之間可以通過其獨創的跨鏈傳輸協議CCTP(The CrossChain Transfer Protocol)實現代幣ZEN以及數據的互聯傳輸,為解決可擴展性問題提供基礎保障。
Horizen採用Zk-snark(零知識證明)以及防51%攻擊等安全解決方案構建了一個具有極高隱私保護性以及安全性的Web3.0區塊鏈平台,為用戶與開發者提供隱私保護。
3.2 AI“雲化”:Web3.0組織AI生產力市場
隨著chatgpt應用的持續爆發,AIGC正在成為全球科技領域的焦點,我們認為AIGC有望成為近五年來最成功、最具創造力的數字科技創新,也將是Web3.0時代重要的生產力。 chatgpt的驚艷體現了一款特定產品的強大生產力,但Web3.0時代可能需要更多維更立體的AI體系。近期,行業興起了對通用人工智能(Artificial general intelligence,AGI)的討論印證了這一點。 AGI 是指在AI模擬人類智能,這些機器能夠在廣泛的領域執行人類可以執行的任何任務,而不是可以在特定任務上表現出色的狹義AI或者專門為一個任務設計的AI機器人。 AGI被認為是一個能夠適應新情況、將其學習推廣到新領域並理解複雜性的人工智能係統。更廣泛的目標是將AI機器像人類經濟市場一樣組織起來,實現更有效的智能生態。
換句話說,如何將AI強大的生產力機器打造成有組織、有智慧的生態系統,還需要機器智慧之外的“運行邏輯”——就像市場規律指導經濟運行一樣,這套運行邏輯將使得AI、數據要素這些重要資源實現更有效的“配置”,即Web3.0時代將不會是一個產品的驚艷,而是一個生態的綻放。這就像是把AI的能力“雲化”:一方面是AI生產力的獲取分散化、去中心化,可以從世界各地廣泛獲取(將多方的資源連接在一起);另一方面這種“雲化”並不是由於某家巨頭廠商提供核心能力,而是將更多分散的AI工具、資源、知識在一個平台/市場上得到更有效的資源配置——解決付費和經濟生態的問題。
本節以SingularityNET為例來探究Web3.0時代是如何組織AI生產力市場。 SingularityNET是一個開放的去中心化人工智能服務自治網絡,可通過Web3.0賬戶身份訪問。開發人員將他們的服務發佈到SingularityNET網絡,用戶在Web3.0市場可以使用它們。開發人員可以使用原生AGIX Token對使用他們的服務進行收費。簡單說,SingularityNET將AI生產力工具組織為一個雲化的市場——將分散各處的代碼、知識、智慧和工具多方面進行連接交互、經濟效率優化。
SingularityNET已經建立了一個去中心化的、自我維持的組織網絡,這些組織通過提供指導、資金和專業知識來推動相關項目的成功。如SingularityNET 的AI-DSL項目將允許一些AI工具像樂高積木一樣連接在一起,並由任何人(甚至非技術用戶)組裝成複雜的工作流程。這一點類似DeFi樂高生態,詳見我們的《DeFi新金融》系列報告。
SingularityNET支持的項目OpenCog Hyperon,旨在基於認知協同原則構建一個完整的、可擴展的、開源的AGI系統。 HyperCycle 將是一種輕量級的二層網絡(Layer2)架構,可以實現大規模的微服務廉價、高速地在鏈上執行。不同的AI模塊——例如神經網絡(NNs/DNNs)、生成式AI、概率AI、程序學習AI等——可以在共享元技術(如API接口)的基礎上進行協作。相當於為各種類型的AI系統提供了一個高度可擴展的學習空間、知識存儲和工具庫,使它們能夠協調學習和一起解決問題——這與人類市場經濟中的創新創業模式是類似的。
3.3 Web3.0主導AI價值實現和社會治理的運行邏輯
DeFi和DAO作為經濟系統和治理系統,是Web3.0時代最具特色的存在。 AI生產力和數據資源需要經濟系統提高配置效率,亦需要治理系統的監管。
3.3.1 DeFi:AI價值實現的新經濟系統
AI能輸出很多精彩的內容,但無法自身實現市場價值——AI價值的體現需要覆蓋更廣泛生態和市場的經濟規則——也就說,集思廣益是好事,解決付費問題是前提。換句話說,AI作為生產力工具,需要一套經濟/金融系統來解放其價值潛力。而Web3.0時代面對廣泛的數據來源、代碼共享者等各種智慧支持,如何解決其內部的付費問題,或者如何激發這樣一個開放世界的經濟潛力? DeFi提供了一種解決方案。
Fabian Schär 發表在美聯儲聖路易斯聯儲官網的研究報告認為:“DeFi可以提高金融基礎設施的效率、透明度和可及性。此外,該系統的可組合性允許任何人將多個應用程序和協議組合起來,從而創建新的、令人興奮的服務。”其中主要包括以下特點:
DeFi之所以能夠擁有這些特點,部分原因是區塊鏈底層代碼的特性決定的,因此,DeFi相對於傳統金融來說,具有低成本、快清算、高效率的特點。而最能提現這些特點的應用便是閃電貸,這是在傳統金融世界完全不存在的事物。
特別是開放的可訪問性和復合性,為AI的演化提供更開放、更高效的生態環境。
3.3.2 Gitcoin:代碼與資源的共享共治平台
AI創新發展的熱潮下,如果你有個新奇的想法需要實現怎麼辦?設立一家公司去拿風投?在大公司爭取個創新部門?去一個眾籌平台?去車庫咖啡碰碰運氣?這些看起來都效率偏低,能不能有個平台讓新奇的點子、投資者人和代碼實現者之間架起橋樑?
Web3.0時代,不僅要解決數據要素市場的問題,AI算法本身的經濟規則也應該有更開放的解決方案——利用更開放、更廣泛的智慧和資金支持AI算法的演進。
Gitcoin便是一種典型的案例,Gticoin是基於以太坊構建的去中心化協作平台,其為開發者提供了一個開發協作平台,同時為投資者提供了一個捐贈平台(加密貨幣捐贈)。可以簡單理解為項目的代碼和資金的眾籌、共享平台。其核心功能主要有:
1)賞金(Bounties):
該分區主要面向廣大Web3.0開發者,開發者可通過發布賞金(Bounty)來針對指定問題尋求外部幫助,其他開發者可以通過解決該問題而獲得賞金獎勵。基於此,項目開發者可以更好的建設社區項目,而解決問題的開發者則可獲得相應的獎勵。
2)黑客松(Hackathons):
該分區下集成有許多Hackathon項目,開發者可在此處加入由各個項目方所贊助的黑客鬆比賽,依照其主題開發相應的產品。
3)捐贈(Grants):
在捐贈分區,用戶可以向一些初創且具有公共物品性質的項目進行捐贈,捐贈結束後,部分項目可能會向捐贈用戶給予空投回報。 Gitcoin捐贈的核心創新在於二次方融資(Quadratic Funding)。在進行二次方融資時,項目所獲資金為社區成員捐出資金的“平方根之和的平方”,即
,之後基金會將根據每個項目的社區二次方融資金額按比例進行配捐。如在一輪募資中共有兩個項目Grant1與Grant2,Grant1獲得來自10個人的1美金等值加密貨幣的捐贈,共計10美金。而Grant2獲得來自1個人的10美金捐贈,共計也是10美金。此時若基金會配捐額度為1100美金,根據二次方融資公式,Grant1能獲得的二次方融資票數為美金,而Grant2能獲得的二次方融資票數為美金。因此按照兩個項目二次方融資的票數,Grant1所能獲得的基金會配捐為 ,而Grant2所能獲得的基金會配捐為 。這樣一來,獲得基金會配捐的往往是那些投票人數更多的項目,而並非投票金額最多的項目。一方面鼓勵了更多用戶參與捐贈投票,從而票選出公共服務性最強的項目。另一方面大大增加了騙取基金會配捐的成本,降低了配捐風險。
Gitcoin目前正在過渡為一個去中心化的項目——Gitcoin Grants Stack,更加開放化,任何人都可以發起和管理自己的項目。
Gitcoin為各類Web3.0初創項目以及想要進一步了解Web3.0的用戶提供了最為友好的孵化平台和學習平台。這對於AI算法的發展提供了更廣泛的智慧支持,更重要的是,Gitcoin的模式為AI算法提供了更加開放的經濟規則和支持,這在Web3.0時代,將是AI生產力工具銳意進取的重要推動力。
投資建議:重視數據要素、網絡安全及內容審查板塊
OpenAI的異軍突起、AIGC的快速迭代讓數據安全、倫理、隱私等問題更加突出。 3月31日,意大利個人數據保護局宣布,從即日起禁止使用聊天機器人ChatGPT,並限制開發這一平台的OpenAI公司處理意大利用戶信息。我們在3月29日的江西(南昌)資本市場高峰論壇上也就AIGC涉及的法律問題進行探討,引發了市場的討論。
我們認為,在數據要素+AIGC的趨勢下,確實“風浪越大,魚越貴”,但在當一切都在加速的時候,全社會是否真正準備好迎接AI時代的衝擊將成為新的聚焦點。如何在開放、安全、隱私之間取得平衡將成為核心。
二級市場,我們建議聚焦:
1)三大運營商,中國電信601728、中國移動600941、中國聯通600050;
2)網絡可視化產業鏈:浩瀚深度688292、恆為科技603496、中新賽克002912;
3)內容審查與IP保護:人民網603000、新華網603888、博匯科技688004;
4)BOSS產業鏈,東方國信300166、天源迪科300047、亞信科技HK1675。
風險提示
區塊鏈商業模式落地不及預期:區塊鏈、密碼學等相關技術和項目處於發展初期,存在商業模式落地不及預期的風險;Move生態發展不及預期。
監管政策的不確定性:區塊鏈項目實際運行過程中涉及到多項金融、網絡及其他監管政策,目前各國監管政策還處於研究和探索階段,並沒有一個成熟的監管模式,所以行業面臨監管政策不確定性的風險。