行走笔记：博弈论视角下的算法稳定模型分析

本篇笔记来自B站UP主Paris Lab 的视频分享。从经济学的供需关系和博弈论角度，分析了算法稳定机制得以持续的基础。

以下，Enjoy：

本期我们以博弈论为主题，引出现在比较流行的算法稳定币的价格机制。节目会涉及非常入门的经济学和博弈论知识，对于没有社科基础的朋友看起来可能会有一点难度，但会尽可能简单的进行介绍。

什么是稳定币就不再额外介绍了。大家耳熟能详的USDT、DAI都属于稳定币。（DAI属于超额抵押类，由以太坊上的借贷平台Maker Dao发行，和完全由算法保持稳定的逻辑不太相同—行走注）我们直奔主题，聊一下稳定币是如何实现币价稳定的。

以泰达币USDT为例，它实现币加稳定的方法就非常的简单粗暴，就是和美元锚定。泰达公司每发行一枚USDT，都应该往公司账户上存一美元。这样就可以实现一比一的存款准备金保证。如果用户想把手头的100万USDT都换成美金，泰达公司直接可以进行1:1的兑换。有了1:1的保证金准备，投资者才会放心觉得，USDT的价格会一直保持稳定。

现在市面上流通着大概700亿枚的USDT。但泰达公司有没有往自己的账户中准备这么多钱呢？就不得而知了。所以从理论上说锚定法定货币的稳定币，价格是稳定，但通过这种方式锚定法币，一般都非常受政府的影响。美联储如果不断的印钱，导致美元持续的贬值。那和美元绑定的USDT的价格也会不断的下降。

更糟糕的事，稳定币的供应商经常和监管机构发生矛盾，容易面临政策风险。

那有没有办法不和法币绑定，也能实现加密货币价格的稳定呢？通过算法当然可以实现。有些算法稳定币的逻辑就是，不用和央行发行的法币挂钩，而是直接用算法实现央行币价调控的功能。

在央行的诸多币价调节手段中，货币的增发、回收是比较好能够用算法来模拟实现的。基本原理如下：

一个币的价格一般由这个币的供给和需求来决定。在一个以数量作为横坐标，以价格作为纵坐标的坐标图中，一个理性投资者会在币价被低估的时候买入，也就是价格越被低估，他越会有买入的需求。因此大部分情况下，需求曲线是向下倾斜的；而供给曲线则刚好相反。理性投资者会在币价被高估的时候更愿意抛出。因此价格越被高估，愿意卖出币的人就会越多。

需求和供给曲线的交点就构成了这个币的市价。很显然，供给和需求都不是一成不变的。尽管有很多币都设置了有限的供给总量，但市场需求却总在不断变化。

当大家都想买一种币，就是需求增大的时候，由于供不应求，币价就会往上走。反过来，供过于求，币价就会下跌。

对于币的发行方而言，它应该如何调节币价的供给，从而实现币价的稳定呢？在币价上涨的时候，它会增加这种币的发行，也就是供给；在币价下跌的时候，它会想办法回收这种币，减少这种币的流通。这样就能让价格重新回到原来的位置上。

这听起来是很简单的，在法币世界中也经常能看到如此的操作。经济高速增长的时候，人们的交易需求量变大，为了防止法币的供不应求，央行就会加速印钞，增加供给；而在通货膨胀太高，供过于求的法币贬值阶段，央行就会把市场上的流动性回购回来，减少供应。

这种方法对于央行之所以有用，是因为央行是中心化的。这个中心化不仅是指决策是由少数的几个专家、官员做出的，更指的是央行的背后会有一大笔的储备金。

所以当我们要把这套方法搬到去中心化的场景中，一方面自然要让全体代币的持有者，也就是整个DAO社区来共同决定价格稳定的政策；另外一方面更重要，是要让社区拥有一个强大的，准备金足够多的金库。

这样才能通过向市场大量的释放或回收流动性，也就是通过控制供给来实现币价的稳定。

具体来说，一个DAO社区要想实现加密货币的价格稳定，大概要遵循如下的逻辑：

要想让币价稳定，就需要能对代币的流动性，也就是代币的供给量实现强有力的调控。有效的调控来自于强有力的一个去中心化的央行。这个央行的储备金主要来自于人们自愿存进去的存款。这里的关键是，社区全体成员要愿意往储备金池子里存钱。

社区成员越愿意存钱，用于调控价格的储备金就越充足。币就越容易被稳定下来。而币价越稳定，就会吸引外部更多的资金流入社区，使得社区成员存进去的钱能够给他们带来更多的分红和收益。赚到的钱多了，社区的成员自然更愿意把这个钱存进去。这样就实现了良性的循环。

要是真能循环起来自然是很好。但关键的问题是循环该如何启动？换句话说，一开始怎么让社区的成员愿意去存钱到公共的存钱罐呢？

这时，就要进入博弈论的领域了。要设计出一个激励机制，鼓励大家把钱尽可能多的存到去中心化的公共储钱罐里。

博弈论研究的是理性主体之间互动策略的学科。博弈论的英文是Game theory，直译为游戏理论。所以我觉得更通俗的说法，博弈论就是用数学建模的方法，对游戏场景中，玩家之间的互动策略进行计算。

在数学建模的过程中，最关键的三个参数是：玩家、策略和报酬。这三个参数在接下来的分析中也会逐一用到。

在进入算法稳定币机制的博弈论分析之前，我们可以先用非常经典的囚徒困境来演示一下博弈论分析的全过程。

在囚徒困境中，游戏中的玩家指的就是两名即将接受审判的犯罪嫌疑人。他们可以选择的策略有两个，一是对犯罪过程完全不说，死都不招；二是如实招来，出卖队友。相应的，两个人的两种策略组合起来，一共会有四种可能的最终可能的报酬情况：

1、两个人都选择死不招供，对犯罪过程只字不提。法庭苦于没有口供，就只能给他们处以最轻的惩罚。两个人都会被罚款1000元；

2、3 种情况，两个人中一个选择死不招供，另一个人却出卖了队友。这样警官就只能确认其中一个人的犯罪事实。那个选择保密但被队友出卖的人，会被处以5000元的罚款，而另外一个人由于出卖了队友，但队友没有出卖他，法庭没有他的犯罪证据，就会被免于处罚；

4、如果两个人都选择了如实交代，出卖队友。那法庭就同时掌握了两个人的证据，就都会被处以3000元的罚款。

把这四种情况写在2乘2的表格中，就可以进行很好的推理了。首先，从集体利益的角度出发，他们应该怎么选择？

对于两个玩家来说，共同利益最大的策略自然是第一种情况，两个人都不招供，这样一共只会被罚款2000元。而让集体最糟糕的情况是第四种，两个人都出卖了对方，导致集体一共被罚款6000元。

但是我们可以从另外一个视角看，如果两个玩家从自身利益的角度出发，他们会选择怎样的策略呢？对于玩家一，如果对方选择了保密，他自己最优的选择自然是出卖队友。因为这样就可以免去1000元的罚款；而如果对方选择出卖自己，自己最优的选择依然是出卖队友，因为3000元的罚款也好过5000元。

因此我们可以得出结论：不管玩家2选择保密还是出卖，理性的玩家1都会选择出卖队友。同理，不管玩家1怎么选择，理性的玩家2也都会选择出卖。于是两个人都选择了出卖这个对集体最糟糕的情况。

如果讲上述这套分析方法用到DAO准备金的问题上，会是怎样的情况呢？

为了简化问题，我们假设世界上一共只有两个人持有某种币，也就是说整个社区就只有两个参与者。这两名玩家可以选择的策略也只有两个，分别是往存钱罐里存钱，或者不往存钱罐里存钱。如果玩家选择存钱到公共的储备金中，储备金变得更多了，他就可以更好的调控币价，币价更稳定就会吸引更多新的资金流入到社区，从而使得社区中的老玩家每个人都可以拿到90元的分红。

但另一方面，把自己的钱拿出来存到公共储钱罐里，相当于是浪费了这笔钱的一部分时间价值。相当于当我做出存钱的决定时，就要付出大约100元的机会成本。

下面我们就根据这样的设定，计算一下四种情况下两名玩家的报酬分别是怎样的。

首先，如果两个人都选择不存，虽然两个人都不用付出100元的机会成本。但这同样会导致整个储备金的不足，币价不稳，没有新资金流入。因此两个人也都拿不到分红。这种情况下，两个人的报酬都为0；

如果一个人选择存钱，一个人选择不存。那这个去中心化的央行至少拿到了一小笔储备金用来稳定币价。币价稍微稳定一点，就会吸引部分新的资金进来。两个玩家就都可以拿到90元的分红。但这里要注意，没拿自己钱放到储备金的玩家可以直接拿到这90元的分红。而选择存钱的玩家在拿到90元分红的同时，又付出了100元的机会成本。所以最终实际的报酬是负的10元；

但如果两个玩家都选择存钱，公共储备金就会非常的充足。币价就稳如泰山，就会导致一大批新的资金涌入。这样两个玩家都可以拿到90乘2，就是180元的分红。扣除掉每个人100元的机会成本，两个人最后的报酬都可以拿到80元。

从集体角度看，很显然两个人的最优选择是都存钱。因为这样双方都可以拿到80元的奖励。而两个人都不存钱，就会导致最糟糕的结果，双方一分钱都拿不到。

但我们还是回到个体的角度，对于玩家一而言，如果对方选择了存钱，自己肯定是不愿意存钱的。不存可以白票90元的分红，存了反而要付出一些成本；而如果对方选择不存钱，他的最佳选择依然还是不存钱。因为不存钱只是拿不到分红，存了反而会亏本。

所以无论怎样，理性的玩家一都会选择不存钱。同理，理性的玩家二也会选择不存钱。搞到最后就没有人愿意存钱进去。这不是完蛋了吗？

回到算法稳定币的逻辑。社区成员愿意存钱，导致社区代币的价格稳定，导致存钱者拿到分红，导致社区成员更愿意存钱。这样的良性循环虽然看起来可以让大家共同富裕，但如果用博弈论实际分析一下，就会觉得非常困难。因为从一开始每个人就根本不愿意承担风险去存钱。

为什么会出现这个问题呢？用专业术语描述，这样的问题是由个体无法将集体中的外部性所内部化引起的。

说人话：如果在一个群体中，每一个人都不关心别人的得失，而只是想着让自己赚最多的钱，获得最大的利益，最终的结果就是谁也别想赚到钱。

那么这样的问题该怎么解决呢？方法无非是调整游戏中的激励机制。也就是在2乘2表格中所看到的数字。

具体的设计，每个项目和每个社区都会有自己的特色。但主要分为两个流派：

1、多多奖励多存钱的行为；

2、对不存钱的行为加以罚款

这样就可以使大家都愿意存钱，使得储备金充足，币价稳定的良性循环可以真正的跑起来。

以上是笔记的全部内容。

根据央行等部门发布“关于进一步防范和处置虚拟货币交易炒作风险的通知”，请读者严格遵守所在地区法律法规，不参与任何违法违规的投资行为。本文内容仅用于信息分享，不对任何经营与投资活动推广进行背书，请读者提高风险防范意识。

聯系郵箱：0xniumao@gmail.com

行走笔记：博弈论视角下的算法稳定模型分析

相关推荐