作者:TapiocaDao

时间:2023.1.19

文章来源:https://mirror.xyz/tapiocada0.eth/aZanJAiDJOqC0dZWiM_L1Mg2mg-yHz2Nl82ALMUpxC0

引言:

当Pearl Labs于2022年初开始开发TapiocaDAO时,其最大的目标之一是在DeFi中构想一种新的经济增长模型。

简而言之,流动性挖矿的主要问题是“不劳而获”。流动性挖矿追逐的是流动性总值(TVL),而资产并没有被锁定,因为流动性提供者可以随时提取资金,同时也无法提供明显的价值。流动性挖矿项目实际上是“撒网式”地奖励代币,希望尽可能多的流动性提供者将尽可能多的流动性租给协议。实际上你无法持续地不劳而获,而在某种程度上,这种不劳而获的东西(激励)其实换言之是无价值的东西。

简而言之,流动性挖矿是不可持续的、不盈利的,而且存在着很大的悖论。

如今的用户要求真实的收益。如果想深入了解流动性挖矿的历史以及我们对当前DeFi经济模型的研究,请阅读我们获得诺贝尔·迪根奖的研究论文《流动性挖矿的终结》:

https://mirror.xyz/tapiocada0.eth/CYZVxI_zyislBjylOBXdE2nS-aP-ZxxE8SRgj_YLLZ0

在流动性挖矿即将退出历史舞台之际,我们开始着手创建twAML(Time Weighted Escrowing和Average Magnitude Lock)(译注:原文中未提及twAML的具体含义)。

第一步是确定这种新经济模型的广泛目标:

1.可持续激励经济增长的方法:通常情况下,激励是被随意分发的,没有计算激励的投资回报率(ROI)或通胀对代币价值的影响的机制。发行往往没有可估计的价格底线,因为代币以零成本分发。因此,除了雇佣的流动性提供者以外,其他各方很快就会被稀释,导致利益的不一致。激励计划很快变成了“维持”计划,试图留住资金。通常情况下,由于雇佣的资本提供者在挖矿和抛售激励代币后离开,导致货币的死亡螺旋,使系统处于失败状态。最后,这些机制还会产生“富豪治理“体系的副作用。

2.接近正向成本/效益的经济刺激:将发行作为资本支出、手续费作为收入以及库存流动性作为资产负债表上的资产,我们迅速发现大多数DeFi协议的支出(发行)远远超过了它们的收入(手续费)、现有资产(储备金)和实际用户增长。许多经过多年运营的协议通过流动性挖矿计划发现,实际上并没有创造真正的价值。因此,Tapioca的激励措施需要与TAP的发行/通胀相协调,产生和创造有形价值。

3.提升和奖励忠诚度:通常情况下,对系统忠诚的参与者受益有限,因为那些图眼前利益的资本提供者获得了所有的好处。通过CRV锁定期限展开忠诚度层级,Vote Escrowing(ve)满足了这一原则。锁定4年?每个CRV获得1个veCRV。锁定1年?每个CRV获得0.25个veCRV,以此类推。你对Curve越忠诚(通过愿意锁定的时间长短),就能获得更多的奖励。

4.创建协议拥有的流动性(POL):协议高度依赖代币价值来稳定其生态系统,因此很脆弱,容易受到市场情绪等外部因素的影响。捕获POL将使Tapioca能够自行稳定,免受这些外部因素的影响。

调研:

在设定这些目标的基础上,我们开始了调研阶段。我们的核心目标是回答一个问题:“应该奖励什么,以及如何奖励?”

ve3,3的锁仓仓位以非同质化代币(NFT)的表示形式,创造了半流动性的托管仓位。这个偏离ve的举措实际上孕育了整个行业(流动性锁定)。这种实践非常有益,因为它将价值留在系统内部,而不是交给第三方流动性锁定提供商(例如Aura和Convex)。此外,它允许系统在托管期间强制令代币保持不可流动,同时允许创建二级市场进行托管仓位的交易。ve3,3的另一个有趣属性是动态调节发行量,然而,与veTKN锁仓挂钩的这种机制对我们来说似乎不太理想。

OHM在twAML的构思阶段中具有许多关键特性。尽管Tapioca的模型与OlympusDAO的重点完全不同,但许多OHM的概念仍然是新颖的,在构思新模型时非常重要,应该给予应有的赞誉。首先,OHM利用激励(债券)来创建协议捕获流动性(POL)的概念是突破性的,这是一种以真实价值交换的激励,实现了永久流动性。这将使Tapioca DAO有能力成为自己的资产提供者,完全消除租借流动性的需求。其次,这个机制还能够阻止外部因素对系统稳定性的影响。其次,OHM利用无风险价值(RFV-Risk-Free Value)建立了可衡量的价格底线,这也是一个非常重要的概念。最后,Olympus使用博弈论(game theory)作为第二个基本理念,科学地优化系统是创造真正动力源的方法。

GMX(以及其他许多高收益资产)具有许多形成性的概念,尽管真实收益不应该是一个特性,而应该是常态。通过真实收益模因运动,我们意识到以以太坊(ETH)支付给托管人比以TAP代币支付给托管人更加有效- 总是必须有一个利润退出系统的点,只是要尽可能减少负面影响。这还为托管提供了额外的外在动力,因为在DeFi中,ETH无疑是最具吸引力的资产。在理论上,“反射型回购”(Reflected Buybacks)可能是一种创造对激励代币产生持续购买动力的好主意,但是当这些奖励被分发时,它们通常会被出售,系统最终会遭受净损失。

前面提到的Vote Escrowing(ve)实施了一种忠诚度机制,这是过去几年来DeFi经济设计中为数不多的重大改进之一。然而,我们不喜欢ve是静态的这一事实- 即一年锁定并输入1.00 CRV始终等于0.25 veCRV,两年锁定等于0.5,四年锁定等于1.0,依此类推。我们希望建立一个动态的系统,让自由市场决定时间的价值。

Convex和Aura提供的Curve和Balancer LP的质押为我们回答“应该奖励什么?”的问题提供了更宏大的思路。我们构想了将托管模型应用于流动性提供(类似于“veLP”的概念)。作为一个货币市场,Tapioca需要足够的流动性储备来使借款人最大程度地利用系统。因此,我们激励计划的目标是激励提供资产,而且锁定资产。

通过这项研究,我们系统的八个核心原则已经确立:

  1. 生成POL(Protocol Owned Liquidity)

  2. 激励资本托管(Capital Escrowing)

  3. 提供真实收益(Real Yield)

  4. 半流动性(NFT)为代表的托管仓位

  5. 对经济活动做出动态响应

  6. 最小化刺激增长的负面影响

  7. 可持续的通胀

  8. 运用博弈论(Game Theory)

设计:

首先,我们需要设计基本的代币经济模型。我们决定采用硬顶/固定总供应量的方式。在代币供应上其实很容易设置一个“软上限”,假装供应是有上限的,直到激励计划结束后继续无限通胀,但一旦打开了这个水龙头,就无法关闭。这一点可以从Compound的COMP奖励调整第二阶段提案中观察到-由于唯利是图的资本提供者控制了Compound的治理,他们不能停止通胀,因为那样做违背了资本提供者的自身利益。

然而,大多数代币经济需要无限通胀的真正原因是因为没有捕获到真正的价值。一旦通胀以某种方式停止,用户和流动性也会随之减少。我们觉得通胀必须在某个时刻结束。我们做出了艰难的决定,即如果通胀在激励结束时没有刺激足够的经济增长和系统价值(POL),那么系统就失败了。此外,研究发现,代币固定供应量的稀缺性对市场参与者更有吸引力,这是有道理的。

下一步是设计TAP的发行。像Convex这样的协议遇到了通胀失控的问题,即CVX的最大供应上限比预期早到达。我们设置了一个预先计算的通胀时间表,以确保TAP的发行速度不会超过预先设定的速度。通胀时间表实际上会成为极限通胀时间表。我们希望确保发行是以内在价值的交换方式进行的,而这种价值将通过激励机制本身创建的POL来实现。如果没有捕获到POL,就不会发行TAP。

我们试图采用类似于"veLP"的系统来确定激励发放的对象,以便作为一个货币市场,Tapioca始终拥有无法被外部因素破坏的充足资本储备。用户将提供资金并获得tOLP LayerZero ONFT收据(Tapioca Omnichain Liquidity Provider Receipt)。然后,用户将锁定tOLP,并在其锁定的每个时期获得激励。这有助于最大化供借方在贷款创建中可以利用的库存,从而通过债务偿还、借款费用和收益表现费用产生费用。更多的流动性=更多的收入和更多的用户。

在设计激励的时候,我们曾考虑使用债券来激励用户锁定资本,因为债券是创建POL最为人所熟知的机制。然而,我们很快意识到债券是一个低效的解决方案。债券没有为激励设定可预测的地板价,也没有估算出资本提供与激励支出之间的可交换关系,因为它与激励的市场价格存在固定的折扣。PoolTogether指出,使用债券比常规的流动性挖矿更刺激了卖压。机器人被编程为购买$POOL/ETH LP以获取折扣后的$POOL,然后将其出售以获利,这进一步怂恿了唯利是图的资本提供者。正如PoolTogether所指出的,更高效的做法是场外出售他们的代币,甚至只是在AMM上出售$POOL代币来产生POL。

我们发行代币的最终目标是创造足够的POL,从而不再需要发行激励- Tapioca将成为其自身流动性池的资本提供者(使用Arrakis保险库来管理流动性池),同时也为Tapioca的借贷市场提供资本。锁仓者将分享平台产生的费用,以Omnichain ETH(tETH)作为奖励单位。DAO将始终以自身最大利益行事,不同于唯利是图的资本提供者。这使得Tapioca生态系统能够抵御外部因素的不稳定性。

但仍然有一个问题:如果不使用债券,我们如何发行TAP以创造POL呢?

一个新选择:

在一个偶然的夜晚,我们偶然发现了Andre Cronje的Keep3r Network的Option Liquidity Mining(OLM),并且迅速确定了奖励代币机制 - DAO股票期权。DAO股票期权是在特定执行价格(特地执行价格=市场价格-折扣)内以特定期限(我们的情况下为一周)购买标的资产的权利(但不是义务)。如果TAP的市场价格出现足够的卖压导致下跌,DAO股票期权将变得不盈利(out of the money,OTM),并且将被置为到期作废。这最大程度地减少了激励经济增长的负面影响。当行使期权时,DAO股票期权还会创造内在价值。

这也使我们能够重新利用该系统创建第一个可持续的空投,即Tapioca的“DAO股票期权空投”(Call Option Airdrop)。通过空投期权,忠诚的社区成员可以获得可观且可估计的奖励,同时最小化羊毛党的负面影响。

这就是我们的激励计划名称的由来;DSO,即DAO Share Options,其名称源自ESO(Employee Stock Options.),即员工股票期权。与ESO不同,公司不直接授予其股票的份额,而是给予股票的衍生期权。DSO与此完全相同,只是借款人取代了员工,代币取代了股票。

相比之下,流动性挖矿可以被视为具有100%折扣和无限到期的DAO股票期权。通过期权,它们设定了可预估的地板价,因为TAP的地板价=加权平均价格(TWAP)- 每个时期的平均折扣百分比。(TAP Price Floor = TWAP - Average Discount % per Epoch)

由于非流通的TAP仅通过行使DAO股票期权注入供应量,预设的通胀计划成为每周可兑换的TAP的最大数量,而不是实际发生的通胀数量。由于DAO股票期权会失去价值(无利润可执行)并且有到期日,这确保了我们可以在较长的时间范围内发行激励,因为每周未通过期权兑换的TAP将被保留在多签名地址中,不会流通。

OLM模型仍存在2个没有解决的问题:

Keep3r的oK3PR赎回款项被重新分配给锁仓用户 - 这意味着从期权赎回中获得的大部分流动性会立刻重新流出系统。

折扣和到期日是固定的- 虽然我们认为到期日应该是固定的,但我们认为固定折扣是低效的- 在经济衰退、增长或停滞期间,系统没有动态调节的能力。

计划已经敲定。我们可以通过将赎回款项重新定向到DAO财库(然后部署到Arrakis Vaults)来重新配置这些期权,现在称为oTAP*。Arrakis Vaults充当去中心化的做市商,DAO财库通过交易自己的代币获得费用。

用户每个epoch锁定tOLP时都会收到oTAP。当用户收到期权(oTAP)时,他们将从DAO进行场外交易(OTC)赎回它-从而创建POL。然后,用户可以选择在AMM上出售这些折扣的TAP获利,或者将其锁定以获得协议收入(和治理)的份额。作为实值(in the money)的DAO股票期权,它们可以被视为比流动性挖矿提供的激励更具吸引力,因为流动性挖矿激励的价值可能会迅速下降。通过oTAP股票期权,用户可以以低于当前市场价值的价格购买TAP-因此这是一份有保证的和可预见的利润。

更大的问题仍然存在,即oKP3R的固定折扣。我们希望创建一个能够根据经济活动动态调节折扣的系统,因此创建了平均幅度锁定(Average Magnitude Lock)机制。

AML(Average Magnitude Lock)机制

如前所述,改变期权折扣是我们创建Average Magnitude Lock(AML)的动机。我们首先设置了两个边界,最低折扣为5%,最高折扣为50%。认购期限被固定为每周一次,因为我们认为每周分发是合适的。当用户根据自己的意愿锁定他们的tOLP时,AML会根据托管持续时间和资本金额进行配置,并提供相应的折扣级别。该折扣级别将在用户托管期间的整个持续时间内锁定。

当系统停滞或下滑(用户停止托管流动性)时,AML将为较短时间的承诺提供更高的折扣,以刺激增长。相反,当系统经历经济增长(许多用户在托管资本)时,AML将降低平均托管期的折扣。即使在可能只需很短时间承诺即可获得大幅折扣的时候,用户仍会被激励锁定比所需时间更长的时间,以获得更长时间的最大折扣。

因此,折扣的调节使我们能够根据锁定时间和资本金额来调节奖励的多少。锁定资本或不锁定资本的用户将“引导”系统的时间奖励比率,始终提供最佳奖励水平。AML的设计使其更容易上升而不容易下降,以防止不良操作者的操纵。

当许多用户锁仓时,系统会为每个后续用户提供越来越小的奖励。当很少用户锁仓时,系统会接收较低的资本锁仓时间,但会提供越来越大的激励(递减),直到触发用户开始锁定新的资本。因此,Tapioca协议及其用户始终能够完美地协调彼此的愿望,并实现优化配置效率。

AML还基于人类的竞争这一心理。用户之间会竞争当前AML所提供的折扣级别。一项竞争研究发现,接近一半的被调查者宁愿在平均工资为25,000美元的世界中赚取50,000美元,而不愿意在平均工资为200,000美元的世界中赚取100,000美元;也就是说,他们更注重相对于他人的收入增加,而不是总体收入更高。

正如这个例子所概述的,人类具有极强的竞争性。一个用户能够获得比后续用户更好的奖励,本身就是一个强大的动力因素。

例如,如果鲍勃锁定100美元,锁定期为一年,并获得30%的折扣,然后莎莉看到她锁定相同金额和相同持续时间,但只能获得15%的折扣,即鲍勃折扣的一半,她会因为内在和外在(利润和竞争性)的激励而将她的锁定时间增加一倍,以获得与鲍勃相同的折扣。

这意味着,与大多数系统(如流动性挖掘)不同,它是“玩家对系统”,AML创造了一个“玩家对玩家”的环境,通过竞争提高了效率。

博弈论入门:

首先,我们通过博弈论的视角分析了流动性挖掘,以科学确定流动性挖掘中的核心问题。博弈论提供了一种数学方法来比较自利和合作的好处。博弈论的目标是研究决策者(称为玩家)的行为,他们的决策会相互影响。

我们很快注意到,流动性挖掘的严重问题在于它激励所有参与者采用yield farming(流动性挖矿)的策略-一种“纯策略”。在流动性挖掘中,我们观察到资本供应者的这种行为,提供资本 > 获得奖励 > 取回资本并出售奖励。

纯策略是为玩家提供最大利润或最佳结果的策略。因此,它被视为每个玩家在游戏中的最佳策略。

不幸的是,这种策略对于系统本身来说是最糟糕的结果。

OlympusDAO以其具有模因的3,3机制而闻名,因此我们也希望对其进行分析。

在OlympusDAO中,每个“玩家”有三个选择:质押、发行债券或出售:

twAML的诞生

如果Ohmie One和Ohmie Two进行质押,+6 (+3, +3)。

如果Ohmie One和Ohmie Two出售,-6 (-3, -3)。

如果Ohmie One出售,而Ohmie Two进行质押,0 (-1, +1)。

在博弈论的显微镜下,我们想确定OlympusDAO是如何实现其迅猛崛起的,以及是什么导致了其随后的衰落。我们很快看到,OlympusDAO创建了一个合作性的“囚徒困境”变体,包含纳什均衡(Nash Equilibrium)。

在经济理论中,纳什均衡用来说明决策是基于其他玩家的行动的战略互动系统。当玩家不需要改变他们的策略时,你就找到了纳什均衡。纳什均衡是博弈论的一部分,用于模拟最大化每个参与者结果的经济行为。

将囚徒困境应用于经济学是一个场景,在这个场景中,合作带来的收益大于追求自利的回报。因此,通过Ohmie之间的合作,奖励被最大化,经济协调得以实现。

但实际上,囚徒困境是什么呢?

囚徒困境:

让我们想象一下,警方没有足够的证据来定罪两名囚犯。警方同时向每名囚犯提供一个交易:要么出卖你的同伙并保持自由,要么保持沉默并冒被出卖和入狱的风险。

在这种情景下可能出现的结果有:

Sam和Caroline都出卖对方- 2,2(两人都被判2年监禁)

Caroline出卖Sam,而Sam保持沉默- 0,3(Caroline不被判刑,Sam被判3年监禁,并被称为傻瓜)

Sam和Caroline都保持沉默- 1,1(两人都被判1年监禁)

twAML的诞生

与我们设定的虚拟囚徒困境中的囚犯不同,OHM(Olympus)的持有者可以进行交流,这意味着他们理论上可以达成共识并继续合作(质押),因为这对每个人来说都是最优。通过持续质押(3,3),OHM持有者本质上是在合作,以免OHM供应进入市场,从而提高OHM的价格并增加OHM的市值。

因此,"3,3" 的前提是如果所有用户都合作并进行质押,而没有用户出售- 每个人都将变得富有。

那么,为什么他们没有这样做呢?

Ohmies困境:

囚徒困境是一种直觉上违背常理的决策困境。在这种情况下,理性的决策是出于个人利益责怪对方囚犯,而最优的决策是囚犯之间相互合作保持沉默,符合集体利益。然而,个体几乎总是会出于自身利益行事,很少选择最优策略。

将这个情况应用到“3,3”中- 在游戏开始时,出售的利润动机较小,因此参与者的自身利益会与系统合作通过质押推动OHM的价值上升(3 + 3 = 6)。

然而,随着参与者继续选择质押的最优选择,潜在利润不断增长。因此,对于玩家来说,偏离策略并出于自身利益进行出售变得越来越有利可图(-3 + -3 = -6)。

“但是我以为囚徒困境和3,3找到了纳什均衡,如果偏离策略变得更好,纳什均衡就会丢失?”

是的,这就是第二个博弈论概念——子博弈完美纳什均衡(SPNE-Subgame Perfect Nash Equilibrium)。只有在博弈的每个子博弈中都存在纳什均衡时,纳什均衡才被称为子博弈完美。就像无限重复的囚徒困境一样,Ohmies Dilemma实现了纳什均衡,但Ohmies Dilemma未能实现像囚徒困境那样的子博弈完美纳什均衡。在游戏进行到许多子博弈时,选择偏离策略(出售,或-6)会变得更有利- 这违背了集体和OHM本身的利益,并选择了出于个人利益的行动。

Pareto Optimal(帕累托最优):

当将博弈论应用于情境中,如囚徒困境,有时博弈论得出的结果并不是最优的,这就是为什么它是一个困境- 理论上存在更好的结果,可以给两位参与者提供更好的回报。有几种方式可以观察到OlympusDAO团队的纳什均衡(以及囚徒困境)严格上是帕累托非有效的。

如果找不到另一种同时提高两位参与者回报的结果,那么这种结果就是帕累托最优的。正如已经指出的,合作质押(+6)的解决方案(也对应于纳什均衡)在某种程度上并不构成帕累托最优,因为在游戏的后期阶段,如果两位Ohmies背叛集体并出售(-6),他们将获得更好的结果,就像两名囚徒个人通过告发将获得更好的结果一样,这也是在“OHM现实游戏”中观察到的情况。

因此,twAML的最终目标是实现帕累托效率的水平,以最大程度地使玩家和系统本身保持一致,确保所有参与者都获得可以改善所有参与者(和系统本身)回报的结果。

帕累托效率意味着资源(在我们的案例中是激励措施)以最经济高效的方式分配,但并不意味着公平。如果没有其他方式能够提高至少一个参与者的回报而不降低任何其他参与者的回报,那么该结果就是帕累托有效的。

因此,通过twAML,当一个玩家选择锁定他们的资本以达到最大化激励(oTAP)折扣水平所需的持续时间时,应用相同的锁定安排的下一个玩家将获得前一个玩家奖励的一半,这在子博弈中一次又一次地得到观察。这是Rubinstein的谈判模型的一种变体。

最佳(集体结果策略)和理性(自利策略)都是锁定足够的资本以获得公平回报所需的时间。因此,twAML也达到了子博弈完美纳什均衡。

当锁仓时机被认为过长以至于无法获得被认为是公平的回报水平时,或者更科学地说,当系统不再具备分配效率时,系统将“衰减”或减少所需的锁定时间,以获得公平的回报,直到再次达到分配高效率。用户个人认为的公平回报并不重要,集体总是决定什么对他们自己和系统本身最有利。

由于博弈论非常复杂,需要非常详细的阐述才能充分解释twAML,如感兴趣请参考以下链接:https://www.jstor.org/stable/1912531

关于时间加权托管(Time-weighted Escrowing)

twTAP(时间加权托管的TAP)也采用了类似于oTAP的AML机制,但有一个区别。边界值不再是0.05到0.50,而是0.10和1.0。这是twTAP的输入与输出之间的比率。twTAP输出 = AML(TAP数量 + 时间持续期)。

在Curve的投票托管(ve)中,如果用户将CRV锁定4年,每个锁定的CRV获得1个veCRV。如果用户选择锁定1年,每个CRV将获得0.25 veCRV。用户的veCRV余额会线性衰减,直到锁仓结束,此时其veCRV余额将变为零。Curve的veCRV允许用户获得费用份额,并参与多种形式的治理,例如Gauge投票和Snapshot投票。

我们认为,应用AML而不是固定值将为twTAP提供更高的效率。因此,如果Tapioca协议的收入很高,用户将有动力锁仓TAP,从而将AML引导到0.10 twTAP/TAP的较低边界值。如果协议收入较低,用户也将有动力锁仓,因为AML将被引导到1.0 twTAP/TAP的最大边界值。

想象一下,在Curve之战的高峰期,为了获得最佳结果,您不得不锁定超过四年的时间。然后在停滞期,如当前的熊市中,您可以锁定较短的时间来获得最佳结果。这就是twTAP的目的。

简而言之,如果用户愿意长期锁仓,因为系统价值很高,会发生什么?或者,如果系统价值很低,这些固定值就不具吸引力了,会发生什么?这种弹性将产生更高的经济效率。

twTAP也是可转让的,并通过LayerZero ONFT-721来实现(类似于oTAP)。这允许创建二级市场来交易,但要求底层的TAP在托管期间保持不流动。忠诚度还和投票权挂钩,您对Tapioca(锁定时间)越忠诚,获得的投票权就越多。

twTAP还提供了恒定的余额,用户的twTAP份额不会像ve那样随着时间减少,也不会像ve3,3那样增加。在锁定结束时,NFT将被销毁,用户将收到原始的TAP余额。

结论:

我们花了一年的时间来研究Time Weighted Average Magnitude Lock(twAML)和DSO(看涨期权),我和0xRektora认为我们已经对DeFi经济模型进行了全面改进。twAML可以实现以下目标:提供可持续且经济高效的经济增长刺激方法,保持所有参与者的经济一致性,建立了民主和基于忠诚度的治理系统,以及首个真正的不糟糕的空投机制。

我们希望您等待的时间是值得的!