原文:《Web3.0驱动下的AIGC与数据要素:开放、安全与隐私

作者:宋嘉吉 任鹤义

摘要

Chatgpt作为最火热的AI产品,其内容生产力是惊艳的,但站在更高层面看,未来Web3.0世界面临两个重要问题:一、数据要素市场的建立,如何解决数据确权和隐私保护?二、AIGC是生产力机器,数据是能源资源,该如何将工业机器和能源资源有效地进行配置?Web3.0为二者提供了高效运转的经济规则和治理规则,就像操作系统一样,为AI生产力、数据要素提供更开放的连接交互和最高效的市场配置。

数据隐私的真谛是确权和授权——即用代码合约明确数据的所有权,通过代码合约完成数据使用权的授权和支付交易。在数据领域,AI与区块链的结合,一方面是数据层,两者可以互相渗透,完全数据确权;另一方面是从应用层面入手,两者各司其职,AI负责自动化的业务处理和智能化的决策,区块链负责在数据层提供可信的授权。这样,数据作为重要的资源,AI作为生产力更有的放矢。

We3.0时代将为AI、数据要素提供一套开放的经济和治理系统。AI作为强大的生产力机器,产出能力无可厚非,但AI输出价值的背后需要一套经济系统和治理系统作为支撑。如果将AI比喻为工业机器,那么数据将是石油等基础资源,而光有工业机器和资源是无法运行的,将工业机器和资源整合的市场经济系统才是价值产出的灵魂;Web3.0就是这样的经济和治理系统,为AIGC(生产力工具)、数据要素、资产和治理提供了一套开放的“操作系统”,AIGC将在Web3.0世界如鱼得水。

Web3.0将从数据、AI“云化”和经济价值挖掘三个维度驱动AI和数据要素发挥更高价值。

1)在AI对数据资源的快速“消耗”背景下,如何在AI训练演化的整个流程周期中对数据完全确权、隐私保护和费用结算?这些离不开Web3.0时代各类数据隐私保护应用的加持。

2)如何将AI强大的生产力机器打造成有组织、有智慧的生态系统,还需要机器智慧之外的使得AI、数据要素这些重要资源实现更有效的“配置”。这就像是把AI的能力“云化”:一方面是AI生产力的获取分散化、去中心化,可以将多方的资源连接在一起;另一方面这种“云化”是将更多分散的AI工具、资源、知识在一个平台/市场上解决付费和经济生态的问题。

3)DeFi和DAO作为经济系统和治理系统,是Web3.0时代最具特色的存在。AI生产力和数据资源需要经济系统提高配置效率,亦需要治理系统的监管。AI作为生产力工具,需要一套经济/金融系统来解放其价值潜力:DeFi提供了一种解决方案。Web3.0时代,不仅要解决数据要素市场的问题,AI算法本身的经济规则也应该有更开放的解决方案——利用更开放、更广泛的智慧和资金支持AI算法的演进。

投资建议:OpenAI的异军突起、AIGC的快速迭代让数据安全、伦理、隐私等问题更加突出。在数据要素+AI的趋势下,如何在安全、高效之间取得平衡将成为热点。二级市场,我们聚焦:

1)三大运营商,中国电信、中国移动、中国联通;

2)可视化产业链:浩瀚深度、恒为科技、中新赛克;

3)内容审查与IP保护:人民网、新华网、博汇科技;

4)BOSS产业链,东方国信、天源迪科、亚信科技。

风险提示:区块链商业模式落地不及预期;监管政策的不确定性。

Web3.0如何驱动AI和数据要素的发展?

1. 核心观点

Chatgpt作为最火热的AI产品,其生产力是惊艳的,但站在更高层面看,未来Web3.0世界面临两个重要问题:一是数据要素市场的建立,如何解决数据确权和隐私保护?二是AI是生产力机器,数据是能源资源,该如何将工业机器和能源资源有效地进行配置?Web3.0为二者提供了高效运转的经济规则和治理规则,就像操作系统一样,为AI生产力、数据要素提供更开放的连接交互和最高效的市场配置。

数据要素的核心问题是确权和隐私保护,AI生产力需要全世界各方更广泛、更开放的连接与交互,这些问题在Web3.0世界得到了很好的解决。本报告从数据、AI“云化”和AI经济价值挖掘三个维度看Web3.0如何驱动AI和数据要素的发展,打造更开放的经济生态。

2. Web3.0时代的数据要素市场、经济和治理问题

2.1Web3.0治理下的数据要素市场使得AI有的放矢

AI时代,随着人脸识别等技术的发展,用户在体验AI服务的同时,时刻都在担心数据泄露风险。这给AI的推广和发展带来了一定阻碍。数据要素是AI工业机器的重要能源,因此,如何解决数据确权、数据安全和隐私保护成为行业发展必须解决的重要问题。

Web3.0如何驱动AI和数据要素的发展?

Web3.0提供了数据市场的治理规则。移动时代以来,尤其是AIGC这种跨时代技术的推动下,数据隐私的保护呼声愈烈,一方面是人们对数据作为一种潜力巨大的价值资源的认识越来越清晰,另一方面作为最密切的产生者,用户越来越注意数据隐私的保护。过去的互联网模式,数据主要存储在互联网公司的云端,用户很难声明对数据的所有权;互联网不断产生的庞杂数据的确权也是出于模糊的“无主”状态,但所有数据实际上都是掌控在互联网公司手中——无论他们如何声明不会泄露数据,不泄露数据不代表我们享有所有权。越来越多的智能服务背后离不开来自于互联网公司AI机器人利用个人隐私数据进行机器学习的结果,这个过程中,用户是被动的,利益上存在受损的嫌疑。Gartner预测,到2024年用于训练AI的数据中有60%将是合成数据,而AI合成的数据又该如何确权,也是一个重要的问题,Web3.0时代正是为这种复杂的数据产生方式提供了更开放更广泛的数据和AI算法来源。

数据隐私的真谛是确权和授权——即用代码合约明确数据的所有权,通过代码合约完成数据使用权的授权和支付交易。作为Web3.0时代的代表性技术,区块链天然就是去中心化和分布式的账本机制,具有数据加密、不可篡改、来源可溯的特点。大量移动端的数据,将由过去“无主”垄断状态,被区块链网络确权给用户,而AI所需要的个人数据,可以由用户向使用方授权完成,甚至费用可以以Token的形式在区块链上完成结算。在数据领域,AI与区块链的结合,一方面是数据层,两者可以互相渗透,完全数据确权;另一方面是从应用层面入手,两者各司其职,AI负责自动化的业务处理和智能化的决策,区块链负责在数据层提供可信的授权。这样,数据作为重要的资源,AI作为生产力更有的放矢。

Web3.0时代,AI和数据要素的演化,将重构互联网商业生态。过去20年互联网巨头们依靠享受大量数据的支配权(实际上用户一直认为数据是属于他们)和强大的网络效应掌控了互联网的主要资源和价值。在技术的快速发展过程中,互联网的商业经历了计算机的开源、软件的开源和数据的开源,曾经的巨头垄断被不断打破。如今,随着区块链、AI和5G等信息技术的崛起,整个互联网加速由巨头互联网公司中心走向分布式和去中心化,价值垄断正在被打破。进入Web3.0时代,AI和数据要素将重构新的商业生态。

Web3.0如何驱动AI和数据要素的发展?

2.2Web3.0作为经济和治理系统为AI生产力提供运行逻辑

AI作为强大的生产力机器,产出能力自然是惊艳的,但AI输出价值的背后需要一套经济系统和治理系统作为支撑。如果将AI比喻为工业机器,那么数据将是石油等基础资源,而光有工业机器和资源是无法运行的——工业机器需要运行逻辑,而资源需要流通和调节供给——将工业机器和资源整合的市场经济系统才是价值产出的灵魂;Web3.0就是这样的经济和治理系统,就像组织创新、生产和流通一样,Web3.0将AI(生产力工具)、数据要素、资产和治理提供了一套开放的“操作系统”,AI将在Web3.0世界如鱼得水。

3. 三个维度看Web3.0如何驱动AI和数据要素

3.1 数据的有效获取:确权和隐私

数据隐私已成为全球监管的焦点问题,现行的解决方案一是强化法律保护,利用区块链等技术完成数据确权;二是引入隐私计算,通过同态加密、多方安全计算、可信执行环境等技术,保证数据在使用过程中是明文不可见的。在AI对数据资源的快速“消耗”背景下,如何在AI训练演化的整个流程周期中对数据完全确权、隐私保护和费用结算?这些离不开Web3.0时代各类数据隐私保护应用的加持。

本节以Horizen为例探讨Web3.0时代如何在数据流转、使用过程中保护隐私。Horizen可以为用户(包括企业用户)提供一个不上传本地隐私数据前提下完成开发的基础区块链平台,企业可以借此为用户提供区块链相关服务,但又充分保护了企业的隐私数据。

Horizen原名Zencash,致力于打造隐私保护和基础区块链平台,为用户或企业可以在不上传本地隐私数据的前提下提供开发平台。Horizen由主链和侧链构成。Horizen主链主要是为用户的交互提供简单且安全的价值传输和存储层,通过原生治理代币ZEN为整个Horizen的生态运转提供支持,以及为侧链提供必要的基础架构。而具体功能的实现以及网络基础结构等均由侧链开发完成,从而能够针对特定的用例进行更为复杂的性能优化,增强其可扩展性和安全性。Horizen侧链又称Zendoo,其具有极高的扩展性和设计性。侧链有独立的共识机制与加密算法,并且真正的实现了去中心化。开发者可通过Horizen开放的一套标准通用组件ZEN侧链开发套件(SDK)来迅速完成区块链的开发,从而节省区块链的构建时间。利用侧链附带的零知识证明工具可以在不上传本地隐私数据的前提下,完成企业需求的开发。

Web3.0如何驱动AI和数据要素的发展?

同时,主链与侧链之间可以通过其独创的跨链传输协议CCTP(The CrossChain Transfer Protocol)实现代币ZEN以及数据的互联传输,为解决可扩展性问题提供基础保障。

Web3.0如何驱动AI和数据要素的发展?

Horizen采用Zk-snark(零知识证明)以及防51%攻击等安全解决方案构建了一个具有极高隐私保护性以及安全性的Web3.0区块链平台,为用户与开发者提供隐私保护。

Web3.0如何驱动AI和数据要素的发展?

3.2 AI“云化”:Web3.0组织AI生产力市场

随着chatgpt应用的持续爆发,AIGC正在成为全球科技领域的焦点,我们认为AIGC有望成为近五年来最成功、最具创造力的数字科技创新,也将是Web3.0时代重要的生产力。chatgpt的惊艳体现了一款特定产品的强大生产力,但Web3.0时代可能需要更多维更立体的AI体系。近期,行业兴起了对通用人工智能(Artificial general intelligence,AGI)的讨论印证了这一点。AGI 是指在AI模拟人类智能,这些机器能够在广泛的领域执行人类可以执行的任何任务,而不是可以在特定任务上表现出色的狭义AI或者专门为一个任务设计的AI机器人。AGI被认为是一个能够适应新情况、将其学习推广到新领域并理解复杂性的人工智能系统。更广泛的目标是将AI机器像人类经济市场一样组织起来,实现更有效的智能生态。

换句话说,如何将AI强大的生产力机器打造成有组织、有智慧的生态系统,还需要机器智慧之外的“运行逻辑”——就像市场规律指导经济运行一样,这套运行逻辑将使得AI、数据要素这些重要资源实现更有效的“配置”,即Web3.0时代将不会是一个产品的惊艳,而是一个生态的绽放。这就像是把AI的能力“云化”:一方面是AI生产力的获取分散化、去中心化,可以从世界各地广泛获取(将多方的资源连接在一起);另一方面这种“云化”并不是由于某家巨头厂商提供核心能力,而是将更多分散的AI工具、资源、知识在一个平台/市场上得到更有效的资源配置——解决付费和经济生态的问题。

本节以SingularityNET为例来探究Web3.0时代是如何组织AI生产力市场。SingularityNET是一个开放的去中心化人工智能服务自治网络,可通过Web3.0账户身份访问。开发人员将他们的服务发布到 SingularityNET网络,用户在Web3.0市场可以使用它们。开发人员可以使用原生 AGIX Token对使用他们的服务进行收费。简单说,SingularityNET将AI生产力工具组织为一个云化的市场——将分散各处的代码、知识、智慧和工具多方面进行连接交互、经济效率优化。

Web3.0如何驱动AI和数据要素的发展?

SingularityNET已经建立了一个去中心化的、自我维持的组织网络,这些组织通过提供指导、资金和专业知识来推动相关项目的成功。如SingularityNET 的 AI-DSL项目将允许一些AI工具像乐高积木一样连接在一起,并由任何人(甚至非技术用户)组装成复杂的工作流程。这一点类似DeFi乐高生态,详见我们的《DeFi新金融》系列报告。

Web3.0如何驱动AI和数据要素的发展?

SingularityNET支持的项目OpenCog Hyperon,旨在基于认知协同原则构建一个完整的、可扩展的、开源的AGI系统。HyperCycle 将是一种轻量级的二层网络(Layer2)架构,可以实现大规模的微服务廉价、高速地在链上执行。不同的 AI模块——例如神经网络 (NNs/DNNs)、生成式AI、概率 AI、程序学习 AI等——可以在共享元技术(如API接口)的基础上进行协作。相当于为各种类型的AI系统提供了一个高度可扩展的学习空间、知识存储和工具库,使它们能够协调学习和一起解决问题——这与人类市场经济中的创新创业模式是类似的。

Web3.0如何驱动AI和数据要素的发展?

3.3 Web3.0主导AI价值实现和社会治理的运行逻辑

DeFi和DAO作为经济系统和治理系统,是Web3.0时代最具特色的存在。AI生产力和数据资源需要经济系统提高配置效率,亦需要治理系统的监管。

3.3.1 DeFi:AI价值实现的新经济系统

AI能输出很多精彩的内容,但无法自身实现市场价值——AI价值的体现需要覆盖更广泛生态和市场的经济规则——也就说,集思广益是好事,解决付费问题是前提。换句话说,AI作为生产力工具,需要一套经济/金融系统来解放其价值潜力。而Web3.0时代面对广泛的数据来源、代码共享者等各种智慧支持,如何解决其内部的付费问题,或者如何激发这样一个开放世界的经济潜力?DeFi提供了一种解决方案。

Fabian Schär 发表在美联储圣路易斯联储官网的研究报告认为:“DeFi可以提高金融基础设施的效率、透明度和可及性。此外,该系统的可组合性允许任何人将多个应用程序和协议组合起来,从而创建新的、令人兴奋的服务。”其中主要包括以下特点:

Web3.0如何驱动AI和数据要素的发展?

DeFi之所以能够拥有这些特点,部分原因是区块链底层代码的特性决定的,因此,DeFi相对于传统金融来说,具有低成本、快清算、高效率的特点。而最能提现这些特点的应用便是闪电贷,这是在传统金融世界完全不存在的事物。

特别是开放的可访问性和复合性,为AI的演化提供更开放、更高效的生态环境。

3.3.2 Gitcoin:代码与资源的共享共治平台

AI创新发展的热潮下,如果你有个新奇的想法需要实现怎么办?设立一家公司去拿风投?在大公司争取个创新部门?去一个众筹平台?去车库咖啡碰碰运气?这些看起来都效率偏低,能不能有个平台让新奇的点子、投资者人和代码实现者之间架起桥梁?

Web3.0时代,不仅要解决数据要素市场的问题,AI算法本身的经济规则也应该有更开放的解决方案——利用更开放、更广泛的智慧和资金支持AI算法的演进。

Gitcoin便是一种典型的案例,Gticoin是基于以太坊构建的去中心化协作平台,其为开发者提供了一个开发协作平台,同时为投资者提供了一个捐赠平台(加密货币捐赠)。可以简单理解为项目的代码和资金的众筹、共享平台。其核心功能主要有:

1)赏金(Bounties):

该分区主要面向广大Web3.0开发者,开发者可通过发布赏金(Bounty)来针对指定问题寻求外部帮助,其他开发者可以通过解决该问题而获得赏金奖励。基于此,项目开发者可以更好的建设社区项目,而解决问题的开发者则可获得相应的奖励。

Web3.0如何驱动AI和数据要素的发展?

2)黑客松(Hackathons):

该分区下集成有许多Hackathon项目,开发者可在此处加入由各个项目方所赞助的黑客松比赛,依照其主题开发相应的产品。

3)捐赠(Grants):

在捐赠分区,用户可以向一些初创且具有公共物品性质的项目进行捐赠,捐赠结束后,部分项目可能会向捐赠用户给予空投回报。Gitcoin捐赠的核心创新在于二次方融资(Quadratic Funding)。在进行二次方融资时,项目所获资金为社区成员捐出资金的“平方根之和的平方”,即

Web3.0如何驱动AI和数据要素的发展?,之后基金会将根据每个项目的社区二次方融资金额按比例进行配捐。如在一轮募资中共有两个项目Grant1与Grant2,Grant1获得来自10个人的1美金等值加密货币的捐赠,共计10美金。而Grant2获得来自1个人的10美金捐赠,共计也是10美金。此时若基金会配捐额度为1100美金,根据二次方融资公式,Grant1能获得的二次方融资票数为Web3.0如何驱动AI和数据要素的发展?美金,而Grant2能获得的二次方融资票数为Web3.0如何驱动AI和数据要素的发展?美金。因此按照两个项目二次方融资的票数,Grant1所能获得的基金会配捐为Web3.0如何驱动AI和数据要素的发展?,而Grant2所能获得的基金会配捐为Web3.0如何驱动AI和数据要素的发展?。这样一来,获得基金会配捐的往往是那些投票人数更多的项目,而并非投票金额最多的项目。一方面鼓励了更多用户参与捐赠投票,从而票选出公共服务性最强的项目。另一方面大大增加了骗取基金会配捐的成本,降低了配捐风险。

Gitcoin目前正在过渡为一个去中心化的项目——Gitcoin Grants Stack,更加开放化,任何人都可以发起和管理自己的项目。

Gitcoin为各类Web3.0初创项目以及想要进一步了解Web3.0的用户提供了最为友好的孵化平台和学习平台。这对于AI算法的发展提供了更广泛的智慧支持,更重要的是,Gitcoin的模式为AI算法提供了更加开放的经济规则和支持,这在Web3.0时代,将是AI生产力工具锐意进取的重要推动力。

投资建议:重视数据要素、网络安全及内容审查板块

OpenAI的异军突起、AIGC的快速迭代让数据安全、伦理、隐私等问题更加突出。3月31日,意大利个人数据保护局宣布,从即日起禁止使用聊天机器人ChatGPT,并限制开发这一平台的OpenAI公司处理意大利用户信息。我们在3月29日的江西(南昌)资本市场高峰论坛上也就AIGC涉及的法律问题进行探讨,引发了市场的讨论。

我们认为,在数据要素+AIGC的趋势下,确实“风浪越大,鱼越贵”,但在当一切都在加速的时候,全社会是否真正准备好迎接AI时代的冲击将成为新的聚焦点。如何在开放、安全、隐私之间取得平衡将成为核心。

二级市场,我们建议聚焦:

1)三大运营商,中国电信601728、中国移动600941、中国联通600050;

2)网络可视化产业链:浩瀚深度688292、恒为科技603496、中新赛克002912;

3)内容审查与IP保护:人民网603000、新华网603888、博汇科技688004;

4)BOSS产业链,东方国信300166、天源迪科300047、亚信科技HK1675。

风险提示

区块链商业模式落地不及预期:区块链、密码学等相关技术和项目处于发展初期,存在商业模式落地不及预期的风险;Move生态发展不及预期。

监管政策的不确定性:区块链项目实际运行过程中涉及到多项金融、网络及其他监管政策,目前各国监管政策还处于研究和探索阶段,并没有一个成熟的监管模式,所以行业面临监管政策不确定性的风险。