贝叶斯纳什均衡(纳什均衡通俗例子)

贝叶斯纳什均衡名词解释

贝叶斯纳什均衡(Bayesian Nash Equilibrium)是不完全信息静态博弈中均衡的一个概念。它要求每个参与人的信念和策略必须是其他参与人信念和策略的最优反应。即给定他人的信念和策略,没有任何一个参与人有积极性选择其他信念或策略。贝叶斯纳什均衡在经济学、金融学、政治学等领域都有广泛的应用。

在完全信息博弈中,存在一个所有参与人都能预测到的均衡结果,即纳什均衡。但在不完全信息博弈中,由于参与人之间的信息不对称,不存在这样一个公共预测的均衡点。此时,需要引入一个外生的概率分布作为参与人的共同先验信念(即“自然”的选择),然后通过贝叶斯法则更新信念,最终实现一个基于这些信念的策略组合,即贝叶斯纳什均衡。

在求解贝叶斯纳什均衡时,通常采用逆向归纳法(Backward Induction)或迭代法(Iterative Method)。逆向归纳法从博弈的最后阶段开始,逐步向前推导每个阶段的均衡策略。迭代法则通过不断调整参与人的信念和策略,直到满足贝叶斯纳什均衡的条件为止。

需要注意的是,贝叶斯纳什均衡并不一定是唯一的,可能存在多个均衡结果。此外,由于不完全信息博弈的复杂性,求解贝叶斯纳什均衡往往需要较高的数学和计算能力。

贝叶斯纳什均衡怎么求

求纳什均衡的常用办法是划线法。

1、首先,看囚徒A,当囚徒B选择“认罪”时,A会选择“认罪”,这时A只被判3年(在A认罪的“3”处划线);当囚徒B选择“不认罪”时,A还是会选择“认罪”,这时A会被释放(在A的认罪的“0”处划线)。

2、其次,囚徒B与囚徒A的选择是一样的,不论A是“认罪”还是“不认罪”,B选“认罪”被判的年数都会少于选择“不认罪”的年数,相应的,在B认罪的“3”和“0”处划线。

3、最后,把上面两个表合在一起,只有策略集(认罪,认罪)是都有划线的,那么这个策略集就是纳什均衡。

贝叶斯纳什均衡的举例说明

某一市场原来被A企业所垄断。现在B企业考虑是否进入。B企业知道,A企业是否允许它进入,取决于A企业阻挠B企业进入所花费的成本。如果阻挠的成本低,A企业的占优战略是阻挠,博弈有重复剔除的占优战略均衡——A阻挠,B不进入。如果阻挠的成本高,A企业的占优战略是默许B进入,博弈有重复剔除的占优战略均衡――A默许,B进入。B企业所不知道的,是A企业的阻挠成本是高是低。这里,某一参与人本人知道、其他参与人则不知道的信息称为私人信息。某一参与人所拥有的全部私人信息称为他的类型。在上述例子中,阻挠成本就是 A的私人信息。高阻挠成本和低阻挠成本则是两种不同的类型。

B所遇到的,是不确定性条件下的选择问题。因为B不仅不知道A的类型(是高还是低),而且不知道不同类型的分布概率。

对于挑战者B来说,原垄断者A在阻挠成本方面,存在着两种可能性:高成本或低成本。B不知道A的阻挠成本究竟是高是低,但他知道A在这两种不同阻挠成本下会作出的选择,以及不同阻挠成本(类型)的分布概率。假定高成本的概率为x,则低成本的概率为(1-x)。如果A的阻挠成本高,A将默许B进入市场;如果A的阻挠成本低,A将阻挠B进入市场。在这两种情况下,B进入的支付函数分别是得到40和失去10。因此,B选择进入所得到的期望利润为40x+(-10)(1- x),选择不进入的期望利润为0。简单的计算表明,当A阻挠成本高的概率大于20%时,挑战者B选择进入得到的期望利润大于选择不进入的期望利润。此时,选择进入是B的最优选择。此时的贝叶斯纳什均衡为,挑战者B选择进入,高成本原垄断者选择默许,低成本原垄断者选择阻挠。

贝叶斯纳什均衡和精炼贝叶斯均衡有什么区别

精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯(纳什)均衡的结合。有些书上或论文中也写成精炼贝叶斯纳什均衡。

具体来说,精炼贝叶斯均衡是所有参与人策略和信念的一种结合。它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的。第二,每个参与人关于其他参与人所属类型的信念,但是使用贝叶斯法则从所观察到的行为中获得的。

完美贝叶斯纳什均衡的要点是在于当事人要根本所观察到的他人的行为来修正自己的有关后者特征的“信念”(主观概率),并由此选择自己的行动。完美贝叶斯纳什均衡是所有局中人策略和信念的一种结合,它满足如下条件:(a)给定每个局中人关于其他局中人特征的概率分布的信息,他的策略选择应该在每一个子博弈都构成贝叶斯均衡,也就是说,给定每个人有关其他人特征的信息的情况下,他的策略等待是最优的;(b)每个人有关他人特征的信念都是使用贝叶斯法则从所观察到的行为中获得的。

而不完全信息静态博弈的均衡称为贝叶斯纳什均衡。