行走笔记:博弈论视角下的算法稳定模型分析



本篇笔记来自BUPParis Lab 的视频分享。从经济学的供需关系和博弈论角度,分析了算法稳定机制得以持续的基础。

 

行走笔记:博弈论视角下的算法稳定模型分析插图1

以下,Enjoy

 

本期我们以博弈论为主题,引出现在比较流行的算法稳定币的价格机制。节目会涉及非常入门的经济学和博弈论知识,对于没有社科基础的朋友看起来可能会有一点难度,但会尽可能简单的进行介绍。

 

什么是稳定币就不再额外介绍了。大家耳熟能详的USDTDAI都属于稳定币。(DAI属于超额抵押类,由以太坊上的借贷平台Maker Dao发行,和完全由算法保持稳定的逻辑不太相同—行走注)我们直奔主题,聊一下稳定币是如何实现币价稳定的。

 

以泰达币USDT为例,它实现币加稳定的方法就非常的简单粗暴,就是和美元锚定。泰达公司每发行一枚USDT,都应该往公司账户上存一美元。这样就可以实现一比一的存款准备金保证。如果用户想把手头的100USDT都换成美金,泰达公司直接可以进行1:1的兑换。有了1:1的保证金准备,投资者才会放心觉得,USDT的价格会一直保持稳定。

 

现在市面上流通着大概700亿枚的USDT。但泰达公司有没有往自己的账户中准备这么多钱呢?就不得而知了。所以从理论上说锚定法定货币的稳定币,价格是稳定,但通过这种方式锚定法币,一般都非常受政府的影响。美联储如果不断的印钱,导致美元持续的贬值。那和美元绑定的USDT的价格也会不断的下降。

 

更糟糕的事,稳定币的供应商经常和监管机构发生矛盾,容易面临政策风险。

 

那有没有办法不和法币绑定,也能实现加密货币价格的稳定呢?通过算法当然可以实现。有些算法稳定币的逻辑就是,不用和央行发行的法币挂钩,而是直接用算法实现央行币价调控的功能。

 

在央行的诸多币价调节手段中,货币的增发、回收是比较好能够用算法来模拟实现的。基本原理如下:

 行走笔记:博弈论视角下的算法稳定模型分析插图3


一个币的价格一般由这个币的供给和需求来决定。在一个以数量作为横坐标,以价格作为纵坐标的坐标图中,一个理性投资者会在币价被低估的时候买入,也就是价格越被低估,他越会有买入的需求。因此大部分情况下,需求曲线是向下倾斜的;而供给曲线则刚好相反。理性投资者会在币价被高估的时候更愿意抛出。因此价格越被高估,愿意卖出币的人就会越多。

 

需求和供给曲线的交点就构成了这个币的市价。很显然,供给和需求都不是一成不变的。尽管有很多币都设置了有限的供给总量,但市场需求却总在不断变化。


行走笔记:博弈论视角下的算法稳定模型分析插图5 

当大家都想买一种币,就是需求增大的时候,由于供不应求,币价就会往上走。反过来,供过于求,币价就会下跌。

 

行走笔记:博弈论视角下的算法稳定模型分析插图7


对于币的发行方而言,它应该如何调节币价的供给,从而实现币价的稳定呢?在币价上涨的时候,它会增加这种币的发行,也就是供给;在币价下跌的时候,它会想办法回收这种币,减少这种币的流通。这样就能让价格重新回到原来的位置上。

 

行走笔记:博弈论视角下的算法稳定模型分析插图9


这听起来是很简单的,在法币世界中也经常能看到如此的操作。经济高速增长的时候,人们的交易需求量变大,为了防止法币的供不应求,央行就会加速印钞,增加供给;而在通货膨胀太高,供过于求的法币贬值阶段,央行就会把市场上的流动性回购回来,减少供应。

 

这种方法对于央行之所以有用,是因为央行是中心化的。这个中心化不仅是指决策是由少数的几个专家、官员做出的,更指的是央行的背后会有一大笔的储备金。

 

所以当我们要把这套方法搬到去中心化的场景中,一方面自然要让全体代币的持有者,也就是整个DAO社区来共同决定价格稳定的政策;另外一方面更重要,是要让社区拥有一个强大的,准备金足够多的金库

 

这样才能通过向市场大量的释放或回收流动性,也就是通过控制供给来实现币价的稳定。

 

具体来说,一个DAO社区要想实现加密货币的价格稳定,大概要遵循如下的逻辑:


行走笔记:博弈论视角下的算法稳定模型分析插图11 

要想让币价稳定,就需要能对代币的流动性,也就是代币的供给量实现强有力的调控。有效的调控来自于强有力的一个去中心化的央行。这个央行的储备金主要来自于人们自愿存进去的存款。这里的关键是,社区全体成员要愿意往储备金池子里存钱。

 

社区成员越愿意存钱,用于调控价格的储备金就越充足。币就越容易被稳定下来。而币价越稳定,就会吸引外部更多的资金流入社区,使得社区成员存进去的钱能够给他们带来更多的分红和收益。赚到的钱多了,社区的成员自然更愿意把这个钱存进去。这样就实现了良性的循环。

 

要是真能循环起来自然是很好。但关键的问题是循环该如何启动?换句话说,一开始怎么让社区的成员愿意去存钱到公共的存钱罐呢?

 

这时,就要进入博弈论的领域了。要设计出一个激励机制,鼓励大家把钱尽可能多的存到去中心化的公共储钱罐里。

 

博弈论研究的是理性主体之间互动策略的学科。博弈论的英文是Game theory,直译为游戏理论。所以我觉得更通俗的说法,博弈论就是用数学建模的方法,对游戏场景中,玩家之间的互动策略进行计算。

 

行走笔记:博弈论视角下的算法稳定模型分析插图13


在数学建模的过程中,最关键的三个参数是:玩家、策略和报酬。这三个参数在接下来的分析中也会逐一用到。

 

在进入算法稳定币机制的博弈论分析之前,我们可以先用非常经典的囚徒困境来演示一下博弈论分析的全过程。

 

在囚徒困境中,游戏中的玩家指的就是两名即将接受审判的犯罪嫌疑人。他们可以选择的策略有两个,一是对犯罪过程完全不说,死都不招;二是如实招来,出卖队友。相应的,两个人的两种策略组合起来,一共会有四种可能的最终可能的报酬情况:


行走笔记:博弈论视角下的算法稳定模型分析插图15 

1、两个人都选择死不招供,对犯罪过程只字不提。法庭苦于没有口供,就只能给他们处以最轻的惩罚。两个人都会被罚款1000元;

 

23 种情况,两个人中一个选择死不招供,另一个人却出卖了队友。这样警官就只能确认其中一个人的犯罪事实。那个选择保密但被队友出卖的人,会被处以5000元的罚款,而另外一个人由于出卖了队友,但队友没有出卖他,法庭没有他的犯罪证据,就会被免于处罚;

 

4、如果两个人都选择了如实交代,出卖队友。那法庭就同时掌握了两个人的证据,就都会被处以3000元的罚款。

 

把这四种情况写在22的表格中,就可以进行很好的推理了。首先,从集体利益的角度出发,他们应该怎么选择?

 

对于两个玩家来说,共同利益最大的策略自然是第一种情况,两个人都不招供,这样一共只会被罚款2000元。而让集体最糟糕的情况是第四种,两个人都出卖了对方,导致集体一共被罚款6000元。

 

但是我们可以从另外一个视角看,如果两个玩家从自身利益的角度出发,他们会选择怎样的策略呢?对于玩家一,如果对方选择了保密,他自己最优的选择自然是出卖队友。因为这样就可以免去1000元的罚款;而如果对方选择出卖自己,自己最优的选择依然是出卖队友,因为3000元的罚款也好过5000元。

 

因此我们可以得出结论:不管玩家2选择保密还是出卖,理性的玩家1都会选择出卖队友。同理,不管玩家1怎么选择,理性的玩家2也都会选择出卖。于是两个人都选择了出卖这个对集体最糟糕的情况。

 

如果讲上述这套分析方法用到DAO准备金的问题上,会是怎样的情况呢?

 

为了简化问题,我们假设世界上一共只有两个人持有某种币,也就是说整个社区就只有两个参与者。这两名玩家可以选择的策略也只有两个,分别是往存钱罐里存钱,或者不往存钱罐里存钱。如果玩家选择存钱到公共的储备金中,储备金变得更多了,他就可以更好的调控币价,币价更稳定就会吸引更多新的资金流入到社区,从而使得社区中的老玩家每个人都可以拿到90元的分红。

 

但另一方面,把自己的钱拿出来存到公共储钱罐里,相当于是浪费了这笔钱的一部分时间价值。相当于当我做出存钱的决定时,就要付出大约100元的机会成本。


行走笔记:博弈论视角下的算法稳定模型分析插图17 

下面我们就根据这样的设定,计算一下四种情况下两名玩家的报酬分别是怎样的。

 

首先,如果两个人都选择不存,虽然两个人都不用付出100元的机会成本。但这同样会导致整个储备金的不足,币价不稳,没有新资金流入。因此两个人也都拿不到分红。这种情况下,两个人的报酬都为0

 

如果一个人选择存钱,一个人选择不存。那这个去中心化的央行至少拿到了一小笔储备金用来稳定币价。币价稍微稳定一点,就会吸引部分新的资金进来。两个玩家就都可以拿到90元的分红。但这里要注意,没拿自己钱放到储备金的玩家可以直接拿到这90元的分红。而选择存钱的玩家在拿到90元分红的同时,又付出了100元的机会成本。所以最终实际的报酬是负的10元;

 

但如果两个玩家都选择存钱,公共储备金就会非常的充足。币价就稳如泰山,就会导致一大批新的资金涌入。这样两个玩家都可以拿到902,就是180元的分红。扣除掉每个人100元的机会成本,两个人最后的报酬都可以拿到80元。

 

从集体角度看,很显然两个人的最优选择是都存钱。因为这样双方都可以拿到80元的奖励。而两个人都不存钱,就会导致最糟糕的结果,双方一分钱都拿不到。

 行走笔记:博弈论视角下的算法稳定模型分析插图19


但我们还是回到个体的角度,对于玩家一而言,如果对方选择了存钱,自己肯定是不愿意存钱的。不存可以白票90元的分红,存了反而要付出一些成本;而如果对方选择不存钱,他的最佳选择依然还是不存钱。因为不存钱只是拿不到分红,存了反而会亏本。

 

所以无论怎样,理性的玩家一都会选择不存钱。同理,理性的玩家二也会选择不存钱。搞到最后就没有人愿意存钱进去。这不是完蛋了吗?

 

回到算法稳定币的逻辑。社区成员愿意存钱,导致社区代币的价格稳定,导致存钱者拿到分红,导致社区成员更愿意存钱。这样的良性循环虽然看起来可以让大家共同富裕,但如果用博弈论实际分析一下,就会觉得非常困难。因为从一开始每个人就根本不愿意承担风险去存钱

 

为什么会出现这个问题呢?用专业术语描述,这样的问题是由个体无法将集体中的外部性所内部化引起的

 

说人话:如果在一个群体中,每一个人都不关心别人的得失,而只是想着让自己赚最多的钱,获得最大的利益,最终的结果就是谁也别想赚到钱

 

那么这样的问题该怎么解决呢?方法无非是调整游戏中的激励机制。也就是在22表格中所看到的数字。

 

具体的设计,每个项目和每个社区都会有自己的特色。但主要分为两个流派:

 

1、多多奖励多存钱的行为;

2、对不存钱的行为加以罚款

 

这样就可以使大家都愿意存钱,使得储备金充足,币价稳定的良性循环可以真正的跑起来。

 

以上是笔记的全部内容。

 

根据央行等部门发布“关于进一步防范和处置虚拟货币交易炒作风险的通知”,请读者严格遵守所在地区法律法规,不参与任何违法违规的投资行为。本文内容仅用于信息分享,不对任何经营与投资活动推广进行背书,请读者提高风险防范意识。

聯系郵箱:0xniumao@gmail.com